Configurando workflows oozie
Video: oozie workflow for Hive queries using Hue dashboard
Conteúdo
Como um motor de workflow, Oozie permite que você execute um conjunto de aplicações Hadoop em uma sequência especificada conhecido como fluxo de trabalho. Você pode configurar fluxos de trabalho Oozie em uma de três maneiras, dependendo de suas circunstâncias particulares. Você pode usar
Video: OOZie Workflow Engine (Hadoop/BigData Workflow Engine) : What is OOZie?
O arquivo config-default.xml: Define os parâmetros que não mudam para o fluxo de trabalho.
Video: Developing Oozie workflow using Pig - 03 Develop workflow.xml
o arquivo job.properties: Define os parâmetros que são comuns para uma implementação particular do fluxo de trabalho. Definições aqui anulam aquelas feitas no arquivo config-default.xml.
o parâmetros de linha de comando: Define parâmetros que são específicos para a invocação do fluxo de trabalho. Definições aqui anulam aquelas feitas no arquivo job.properties eo arquivo config-default.xml.
Video: What is Oozie in Hadoop
Os detalhes de configuração será diferente, dependendo da ação que eles estão associados. Por exemplo, como você pode ver na ação MapReduce (mapa de ação) no seguinte perfil, você tem muito mais coisas para configurar lá:
...@@ 1 serverName: 8021serverName: 8020 @@ 2 ...@@ 3 jobConfig.xml ... mapreduce.map.class dummies.oozie.FlightMilesMapper mapreduce.reduce.class dummies.oozie.FlightMilesReducer mapred.mapoutput.key.class org.apache.hadoop.io.Text mapred.mapoutput.value.class org.apache.hadoop.io.IntWritable mapred.output.key.class org.apache.hadoop.io.Text mapred.output.value.class org.apache.hadoop.io.IntWritable mapred.input.dir ‘/ Usr / Dirk / flightdata’ ... mapred.output.dir ‘/ Usr / Dirk / flightmiles’
Ao contrário de um sistema de arquivos (fs) ação como a mostrada aqui:
......