但开发人员行走于Unix之间,依然有四样东西要熟练。
一、VI
虽然Unix上的文本编辑器已经越来越好用,但不在Console前面,网速也不够连XWindows的时候,还是要依赖VI。
回想VI的时代背景,发现VI对开发人员已经周到得离谱了,热键多到你双手不离键盘就能完成大半编辑工作。
建议自己制作一张自己认为有用,但又经常忘记的命令的sheet,拿出考试的力气把它背熟。
二、文本处理
开发人员在Unix下干得最多的除了Make和除Bug外,大概就是处理日志文件、业务文件进行查错和统计了。
只会more和grep是不够的,开发老手会把awk,sed,grep,sort,unique,wc这些文本处理命令,通过管道玩具式的拆卸拼装,最后完成一件原本以为非编写大段代码不可的工作。周到的参数设定,让人再一次感叹那个简单的年代,复杂到极致的设计.......怪不得《Unix 编程艺术》的作者有那么骄傲的自觉。
比如车东的每月访问TOP10 统计脚本:
- awk -F '/t' 将2004_2.txt访问纪录文件,用TAB分割,打印第4列
- grep chedong.com/tech 只列出chedong.com/tech笔记目录下的文档;
- sort 排序
- uniq -c 汇总计数
- sort -rn 按数值排序
-
head -10 TOP 10
三、Bash Shell 编程
编程是开发人员的天赋技能,不论什么语言,看看参考手册应该就能上手。见
Bash新手指南中文版
四、Make与AutoMake
用过Java的Ant后,想起Make就觉得很烦,很厌倦。总归还是会的,见
GNU Make 3.8.0 中文手册
不过即使make已经精通到变态,每个人写出来的MakeFile还是千奇百怪,再看看开源项目们个个都是automake+autoconf,我们自己也长进一点吧。
大家先编写MakeFile.am,auotomake后变成MakeFile.in,用户./configure 后就能生成最终的MakeFile。
MakeFile.am 生成的MakeFile既能跨越平台,又是标准的写法,最重要的是,编写MakeFile.am的工作量比MakeFile少多了,只要简单的定义要目标文件,先要处理的子目录,需要的源文件,INCLUDES文件与库文件就可以了。
另外,ACE里还贡献了一个更厉害的
MPC(Makefile, Project, and Workspace Creator )
,自动的生成MakeFile.am或者VC的项目文件。
入门:
使用AutoMake轻松生成Makefile
进阶:
例解 autoconf 和 automake 生成 Makefile 文件
附录A:我的VI易忘命令手册
上下左右:
ctrl+u/d 上下半屏,ctrl+f/b,上下一屏
H/G屏幕头/末 ,0/$ 行首行末
增删改:
yy/dd 复制/删除 一行,p/P:将yy/dd的内容paste出来
I/A 在行首/末添加, o/O 开新行,d0/d$ 删除到行首,行末
u:undo
查:
? 向前查找, n/N 重复上一次查找
附录B: 文本处理命令小结
awk:
处理结构化的文本(每行以固定符号分成若干列),提取打印某些字段,如:
ls -l|awk '{print $1}' --将ls-l结果的第一列打印出来
awk -F":" '{print $1" "$6}' /etc/passwd ,将以:分割的/etc/passwd文件的第1,6列打印出来,中间以空格分开
详见IBM的教程:
http://www-128.ibm.com/developerworks/cn/linux/shell/awk/awk-1/index.html
(共3篇)
grep:
过滤,大家用得最多的命令,支持正则表达式。参数有:
-i忽略大小写,-n显示line number,-c 统计在每个文件的出现次数,-l只显示符合的文件的名字。
sed:
替换,如:
sed -e '1,10s/foo/bar/g' myfile2.txt 将1到10行的文本中的foo 替换成bar,s代表替换,g代表全局替换
支持正则的替换字符串,可以只替换某个范围内的内容。
用法不算简单,详见IBM的
http://www.ibm.com/developerworks/cn/linux/shell/sed/sed-1/index.html
(共三章)
sort:
排序,参数有:
-r逆序, -n 数字比较 ,-M 日历比较 Feb,Dec,-f 忽略大小写
同样支持结构化文件,如
sort -t : -k 1,1 /etc/passwd,以: 分割,只按第1列排序
sort -t : -k 1,1 -k2.2,3.4 /etc/passwd ,以:分割,先按第1列排序,再按第2列的第二个字符到第3列的第4个字符排序。
uniq:
去除重复行。
除了正常用法外,还有-u (唯一)和 -d (重复)两个参数,只显示唯一的和重复的行。
wc:
统计。
-l 行,-m 字符,-w 单词
PS:以下文字不算字数
一个多月没有更新博客了,因为公司里调了新部门,很多东西要学习。太久没试过华丽的在上班时间,在工作中,在同事们身上学到这么多东西了,很是开心。
下周开始爆发更新。