共计 2578 个字符,预计需要花费 7 分钟才能阅读完成。
博主使用这个模块,主要想利用这个去循环执行hive脚本,调用shell去执行,同时也要适当的时候将结果输出到指定的位置。
一、subprocess
运行python的时候,我们都是在创建并运行一个进程。
subprocess.call()
父进程等待子进程完成
返回退出信息(returncode,相当于Linux exit code)
subprocess.check_call()
父进程等待子进程完成
返回0
检查退出信息,如果returncode不为0,则举出错误subprocess.CalledProcessError,该对象包含有returncode属性,可用try…except…来检查
subprocess.check_output()
父进程等待子进程完成
返回子进程向标准输出的输出结果
检查退出信息,如果returncode不为0,则举出错误subprocess.CalledProcessError,该对象包含有returncode属性和output属性,output属性为标准输出的输出结果,可用try…except…来检查。
这三个函数的使用方法相类似,下面来以subprocess.call()举例说明:
>>> retcode = subprocess.call([“ls”, “-l”])
#和shell中命令ls -a显示结果一样
>>> print retcode
0
shell默认为False,在Linux下,shell=False时, Popen调用os.execvp()执行args指定的程序;shell=True时,如果args是字符串,Popen直接调用系统的Shell来执行args指定的程序,如果args是一个序列,则args的第一项是定义程序命令字符串,其它项是调用系统Shell时的附加参数。
上面例子也可以写成如下:
在Windows下,不论shell的值如何,Popen调用CreateProcess()执行args指定的外部程序。如果args是一个序列,则先用list2cmdline()转化为字符串,但需要注意的是,并不是MS Windows下所有的程序都可以用list2cmdline来转化为命令行字符串。
使用popen才是这篇文章的重点,这个函数提供了输入输出流的处理,并且调用shell去执行,将输出的结果重定向到指定的文件,然后程序再去解析。
subprocess.Popen()
实际上,上面的几个函数都是基于Popen()的封装(wrapper)。这些封装的目的在于让我们容易使用子进程。当我们想要更个性化我们的需求的时候,就要转向Popen类,该类生成的对象用来代表子进程。
与上面的封装不同,Popen对象创建后,主程序不会自动等待子进程完成。我们必须调用对象的wait()方法,父进程才会等待 (也就是阻塞block),举例:
这里的wait是重点,在正常情况下你是通过fork一个新的子进程来实现你的需求,那么父进程如果你没有告诉它要等待子进程那么父进程直接运行结束了,你想要的结果也无法处理。
>>> child = subprocess.Popen([‘ls’,’-al’])
>>> print ‘parent process’
从运行结果中看到,父进程在开启子进程之后并没有等待child的完成,而是直接运行print。
对比等待的情况:
>>> child = subprocess.Popen(‘ls -al’,shell=True)
>>> child.wait()
>>> print ‘parent process’
从运行结果中看到,父进程在开启子进程之后并等待child的完成后,再运行print。
此外,你还可以在父进程中对子进程进行其它操作,比如我们上面例子中的child对象:代码如下:
child.kill() # 终止子进程
child.send_signal() # 向子进程发送信号
child.terminate() # 终止子进程
子进程的PID存储在child.pid
二、子进程的文本流控制
子进程的标准输入、标准输出和标准错误如下属性分别表示:
child.stdout
child.stderr
常见的可以定义一个文件流,然后赋值到stdout,那么子进程的输出将会写到指定的文件当中去。也可以在Popen()建立子进程的时候改变标准输入、标准输出和标准错误,并可以利用subprocess.PIPE将多个子进程的输入和输出连接在一起,构成管道(pipe),如下2个例子:
>>> child1 = subprocess.Popen([“ls”,”-l”], stdout=subprocess.PIPE)
>>> print child1.stdout.read(),
#或者child1.communicate()
>>> import subprocess
>>> child1 = subprocess.Popen([“cat”,”/etc/passwd”], stdout=subprocess.PIPE)
>>> child2 = subprocess.Popen([“grep”,”0:0″],stdin=child1.stdout, stdout=subprocess.PIPE)
>>> out = child2.communicate()