大数据平台监控指标

hadoop metrics2

监控的内容:

yarn
jvm
rpc
rpcdetailed
metricssystem
mapred
dfs
ugi

已经提供的:

Source : `org.apache.hadoop.metrics2.source.JvmMertics` 和`org.apache.hadoop.metrics2.source.JvmMetricsInfo`

其他相关

FSOpDurations : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSOpDurations`

fairscheduler-op-durations context :

  @Metric("Duration for a continuous scheduling run")  MutableRate continuousSchedulingRun;
  @Metric("Duration to handle a node update")  MutableRate nodeUpdateCall;
  @Metric("Duration for a update thread run")  MutableRate updateThreadRun;
  @Metric("Duration for an update call")  MutableRate updateCall;
  @Metric("Duration for a preempt call") MutableRate preemptCall;

QueueMetrics : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.QueueMetrics`

yarn context :

  @Metric("# of apps submitted") MutableCounterInt appsSubmitted;
  @Metric("# of running apps") MutableGaugeInt appsRunning;
  @Metric("# of pending apps") MutableGaugeInt appsPending;
  @Metric("# of apps completed") MutableCounterInt appsCompleted;
  @Metric("# of apps killed") MutableCounterInt appsKilled;
  @Metric("# of apps failed") MutableCounterInt appsFailed;
  @Metric("Allocated memory in MB") MutableGaugeInt allocatedMB;
  @Metric("Allocated CPU in virtual cores") MutableGaugeInt allocatedVCores;
  @Metric("# of allocated containers") MutableGaugeInt allocatedContainers;
  @Metric("Aggregate # of allocated containers") MutableCounterLong aggregateContainersAllocated;
  @Metric("Aggregate # of released containers") MutableCounterLong aggregateContainersReleased;
  @Metric("Available memory in MB") MutableGaugeInt availableMB;
  @Metric("Available CPU in virtual cores") MutableGaugeInt availableVCores;
  @Metric("Pending memory allocation in MB") MutableGaugeInt pendingMB;
  @Metric("Pending CPU allocation in virtual cores") MutableGaugeInt pendingVCores;
  @Metric("# of pending containers") MutableGaugeInt pendingContainers;
  @Metric("# of reserved memory in MB") MutableGaugeInt reservedMB;
  @Metric("Reserved CPU in virtual cores") MutableGaugeInt reservedVCores;
  @Metric("# of reserved containers") MutableGaugeInt reservedContainers;
  @Metric("# of active users") MutableGaugeInt activeUsers;
  @Metric("# of active applications") MutableGaugeInt activeApplications;

FSQueueMetrics : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSQueueMetrics`

yarn context :

  @Metric("Fair share of memory in MB") MutableGaugeInt fairShareMB;
  @Metric("Fair share of CPU in vcores") MutableGaugeInt fairShareVCores;
  @Metric("Steady fair share of memory in MB") MutableGaugeInt steadyFairShareMB;
  @Metric("Steady fair share of CPU in vcores") MutableGaugeInt steadyFairShareVCores;
  @Metric("Minimum share of memory in MB") MutableGaugeInt minShareMB;
  @Metric("Minimum share of CPU in vcores") MutableGaugeInt minShareVCores;
  @Metric("Maximum share of memory in MB") MutableGaugeInt maxShareMB;
  @Metric("Maximum share of CPU in vcores") MutableGaugeInt maxShareVCores;

MetricsSystemImpl : `org.apache.hadoop.metrics2.impl.MetricsSystemImpl`

metricssystem context :

  @Metric({"Snapshot", "Snapshot stats"}) MutableStat snapshotStat;
  @Metric({"Publish", "Publishing stats"}) MutableStat publishStat;
  @Metric("Dropped updates by all sinks") MutableCounterLong droppedPubAll;

Sink : `org.apache.hadoop.metrics2.sink.GraphiteSink` 和`org.apache.hadoop.metrics2.sink.FileSink` 以及`org.apache.hadoop.metrics2.sink.AbstractGangliaSink`

metricsSystem : `org.apache.hadoop.metrics2.lib.DefaultMetricsSystem`

自我实现:

Source : org.apache.hadoop.metrics2.MetricsSource
Sink : org.apache.hadoop.metrics2.MetricsSink
MetricsSystem : org.apache.hadoop.metrics2.MetricsSystem

使用方式:

$HADOOP_HOME/etc/hadoop/hadoop-metrics2.properties中配置就可以

spark metrics

可以获取到的内容主要有:

master
applications
worker
executor
driver
实现的Sink有

ConsoleSink : org.apache.spark.metrics.sink.ConsoleSink

CSVSink : org.apache.spark.metrics.sink.CSVSink

JmxSink : org.apache.spark.metrics.sink.JmxSink

MetricsServlet : org.apache.spark.metrics.sink.MetricsServlet

GraphiteSink : org.apache.spark.metrics.sink.GraphiteSink

Slf4jSink : org.apache.spark.metrics.sink.Slf4jSink

实现的Source有

JvmSource : org.apache.spark.metrics.source.JvmSource

ApplicationSource : org.apache.spark.deploy.master.ApplicationSource
status
runtime_ms
cores
BlockManagerSource : org.apache.spark.storage.BlockManagerSource
maxMem_MB
remainingMem_MB
memUsed_MB
diskSpaceUsed_MB
DAGSchedulerSource : org.apache.spark.scheduler.DAGSchedulerSource
failedStages
runningStages
waitingStages
allJobs
activeJobs
ExecutorAllocationManagerSource : org.apache.spark.ExecutorAllocationManagerSource
numberExecutorsToAdd
numberExecutorsPendingToRemove
numberAllExecutors
numberTargetExecutors
numberMaxNeededExecutors
ExecutorSource : org.apache.spark.executor.ExecutorSource
activeTasks
completeTasks
currentPool_size
maxPool_size
read_bytes
write_bytes
read_ops
largeRead_ops
write_ops
MasterSource : org.apache.spark.deploy.master.MasterSource
workers
aliveWorkers
apps
waitingApps
MesosClusterSchedulerSource : org.apache.spark.scheduler.cluster.mesos.MesosClusterSchedulerSource
waitingDrivers
launchedDrivers
retryDrivers
WorkerSource : org.apache.spark.deploy.worker.WorkerSource
executors
coresUsed
memUsed_MB
coresFree
memFree_MB

cjuexuan / mynote

大数据平台监控指标 #18

hadoop metrics2

Source : `org.apache.hadoop.metrics2.source.JvmMertics` 和`org.apache.hadoop.metrics2.source.JvmMetricsInfo`

FSOpDurations : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSOpDurations`

QueueMetrics : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.QueueMetrics`

FSQueueMetrics : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSQueueMetrics`

MetricsSystemImpl : `org.apache.hadoop.metrics2.impl.MetricsSystemImpl`

Sink : `org.apache.hadoop.metrics2.sink.GraphiteSink` 和`org.apache.hadoop.metrics2.sink.FileSink` 以及`org.apache.hadoop.metrics2.sink.AbstractGangliaSink`

metricsSystem : `org.apache.hadoop.metrics2.lib.DefaultMetricsSystem`

spark metrics

实现的Sink有

ConsoleSink : `org.apache.spark.metrics.sink.ConsoleSink`

CSVSink : `org.apache.spark.metrics.sink.CSVSink`

JmxSink : `org.apache.spark.metrics.sink.JmxSink`

MetricsServlet : `org.apache.spark.metrics.sink.MetricsServlet`

GraphiteSink : `org.apache.spark.metrics.sink.GraphiteSink`

Slf4jSink : `org.apache.spark.metrics.sink.Slf4jSink`

实现的Source有

JvmSource : `org.apache.spark.metrics.source.JvmSource`

ApplicationSource : `org.apache.spark.deploy.master.ApplicationSource`

BlockManagerSource : `org.apache.spark.storage.BlockManagerSource`

DAGSchedulerSource : `org.apache.spark.scheduler.DAGSchedulerSource`

ExecutorAllocationManagerSource : `org.apache.spark.ExecutorAllocationManagerSource`

ExecutorSource : `org.apache.spark.executor.ExecutorSource`

MasterSource : `org.apache.spark.deploy.master.MasterSource`

MesosClusterSchedulerSource : `org.apache.spark.scheduler.cluster.mesos.MesosClusterSchedulerSource`

WorkerSource : `org.apache.spark.deploy.worker.WorkerSource`

cjuexuan / mynote

大数据平台监控指标 #18

hadoop metrics2

Source : org.apache.hadoop.metrics2.source.JvmMertics 和org.apache.hadoop.metrics2.source.JvmMetricsInfo

FSOpDurations : org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSOpDurations

QueueMetrics : org.apache.hadoop.yarn.server.resourcemanager.scheduler.QueueMetrics

FSQueueMetrics : org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSQueueMetrics

MetricsSystemImpl : org.apache.hadoop.metrics2.impl.MetricsSystemImpl

Sink : org.apache.hadoop.metrics2.sink.GraphiteSink 和org.apache.hadoop.metrics2.sink.FileSink 以及org.apache.hadoop.metrics2.sink.AbstractGangliaSink

metricsSystem : org.apache.hadoop.metrics2.lib.DefaultMetricsSystem

spark metrics

实现的Sink有

ConsoleSink : org.apache.spark.metrics.sink.ConsoleSink

CSVSink : org.apache.spark.metrics.sink.CSVSink

JmxSink : org.apache.spark.metrics.sink.JmxSink

MetricsServlet : org.apache.spark.metrics.sink.MetricsServlet

GraphiteSink : org.apache.spark.metrics.sink.GraphiteSink

Slf4jSink : org.apache.spark.metrics.sink.Slf4jSink

实现的Source有

JvmSource : org.apache.spark.metrics.source.JvmSource

ApplicationSource : org.apache.spark.deploy.master.ApplicationSource

BlockManagerSource : org.apache.spark.storage.BlockManagerSource

DAGSchedulerSource : org.apache.spark.scheduler.DAGSchedulerSource

ExecutorAllocationManagerSource : org.apache.spark.ExecutorAllocationManagerSource

ExecutorSource : org.apache.spark.executor.ExecutorSource

MasterSource : org.apache.spark.deploy.master.MasterSource

MesosClusterSchedulerSource : org.apache.spark.scheduler.cluster.mesos.MesosClusterSchedulerSource

WorkerSource : org.apache.spark.deploy.worker.WorkerSource

Source : `org.apache.hadoop.metrics2.source.JvmMertics` 和`org.apache.hadoop.metrics2.source.JvmMetricsInfo`

FSOpDurations : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSOpDurations`

QueueMetrics : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.QueueMetrics`

FSQueueMetrics : `org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FSQueueMetrics`

MetricsSystemImpl : `org.apache.hadoop.metrics2.impl.MetricsSystemImpl`

Sink : `org.apache.hadoop.metrics2.sink.GraphiteSink` 和`org.apache.hadoop.metrics2.sink.FileSink` 以及`org.apache.hadoop.metrics2.sink.AbstractGangliaSink`

metricsSystem : `org.apache.hadoop.metrics2.lib.DefaultMetricsSystem`

ConsoleSink : `org.apache.spark.metrics.sink.ConsoleSink`

CSVSink : `org.apache.spark.metrics.sink.CSVSink`

JmxSink : `org.apache.spark.metrics.sink.JmxSink`

MetricsServlet : `org.apache.spark.metrics.sink.MetricsServlet`

GraphiteSink : `org.apache.spark.metrics.sink.GraphiteSink`

Slf4jSink : `org.apache.spark.metrics.sink.Slf4jSink`

JvmSource : `org.apache.spark.metrics.source.JvmSource`

ApplicationSource : `org.apache.spark.deploy.master.ApplicationSource`

BlockManagerSource : `org.apache.spark.storage.BlockManagerSource`

DAGSchedulerSource : `org.apache.spark.scheduler.DAGSchedulerSource`

ExecutorAllocationManagerSource : `org.apache.spark.ExecutorAllocationManagerSource`

ExecutorSource : `org.apache.spark.executor.ExecutorSource`

MasterSource : `org.apache.spark.deploy.master.MasterSource`

MesosClusterSchedulerSource : `org.apache.spark.scheduler.cluster.mesos.MesosClusterSchedulerSource`

WorkerSource : `org.apache.spark.deploy.worker.WorkerSource`