Kosmos distributed file system (KFS)是一个专门为数据密集型应用(搜索引擎,数据挖掘等)而设计的存储系统,类似于Google的GFS和Hadoop的HDFS分布式文件系统。 KFS使用C++实现,支持的客户端包括C++,Java和Python。
以前曾在开源KFS基础上做过开发,这里介绍一下如何进行KFS的源码编译与安装过程(以kfs-0.5为例)。
1.安装依赖软件
为了编译和运行KFS文件系统,需要安装以下软件包:
- Boost (1.34或以上)
- cmake (2.4.6或以上)
- log4cpp (1.0或以上)
- gcc version ( 4.1或以上)
- xfs devel RPMs on Linux
下面介绍的是手动安装以上软件包的过程,这里假设你已经下载完成软件包压缩文件。
1、安装gcc
      1 tar zxvf gcc-4.1.2.tar.gz
      
      2 mkdir/usr/local/gcc-4.1.2
      
      3 cd gcc-4.1.2
      
      4 ./configure --prefix=/usr/local/gcc-4.1.2 --enable-threads=posix --disable-checking --enable--long-long --host=i386-redhat-linux--with-system-zlib --enable-languages=c,c++,java
      
      5 make
      
      6 make install
    
  备注:以上过程将gcc安装在/usr/local/gcc-4.1.2目录下,支持C/C++和JAVA语言,其它选项参见gcc提供的帮助说明。
2、安装log4cpp
      1 tar xvzf log4cpp-1.0.tar.gz
      
      2 cd log4cpp-1.0
      
      3 ./configure
      
      4 make
      
      5 make install
    
  3、安装xfs
      1 tar xvzf xfsprogs-3.0.1.tar.gz
      
      2 cd xfsprogs-3.0.1
      
      3 ./configure
      
      4 make
      
      5 make install
      
      6 make install-dev
    
  4、安装cmake
      1 tar xvzf cmake-2.6.4.tar.gz
      
      2 cd cmake-2.6.4
      
      3 ./bootstrap
      
      4 make
      
      5 make install
    
  5、安装boost
      1 tar xvzf boost_1_39_0.tar.gz
      
      2 cd boost_1_39_0
      
      3 ./bootstrap.sh
      
      4 ./bjam -sTOOLS=gcc --without-python install
    
  2.编译和安装KFS
首先,到sourceforge下载kfs-0.5.tar.gz( 点击下载 ),这里假设下载后目录为用户根目录。
然后,解压KFS软件包,这里假设解压后KFS所在目录:~/kfs-0.5,编译源码所在目录:~/kfs-0.5/build。
为了完整编译KFS,需要有以下三部分:
- 编译C++部分,生成MetaServer/ChunkServer,各种API操作的tools,C++客户端;
- 编译Java部分,生成kfs.jar,即Java客户端,以通过Java JNI调用本地的C++方法;
- 编译Python扩展模块,生成Python客户端。
2.1 编译C++部分
      1 tar xvzf kfs-0.5.tar.gz
      
      2 cd kfs-0.5
      
      3 mkdir build
      
      4 cd build
      
      5 cmake -D CMAKE_BUILD_TYPE=RelWithDebInfo ~/kfs-0.5
      
      6 gmake
      
      7 gmake install
    
  编译之后,二进制文件将被安装在以下目录:
- 
      可执行文件:~/kfs-0.5/build/bin
      
        
 
- 
      库文件:~/kfs-0.5/build/lib
      
        
 
备注:编译KFS过程中,带上了debug调试信息。
2.2 编译Java部分
      1 cd ~/kfs-0.5
      
      2 ant jar
    
  编译之后,生成的文件为:
- Java class文件:~/kfs-0.5/build/classes
- Java Jar包:~/kfs-0.5/build/kfs-0.5.jar
最后,将生成的Jar包添加到CLASSPATH环境变量中:
      1 export CLASSPATH=${CLASSPATH}:~/kfs-0.5/build/kfs-0.5.jar
    
  2.3 编译Python扩展模块
为了编译Python扩展模块,首先需要进行步骤2.1,生成KFS客户端库文件,这里库文件所在目录是:~/kfs-0.5/。
编译Python扩展模块的步骤:
      1 cd to ~/kfs-0.5/src/cc/access
      
      2 Edit kfs_setup.py and setup the include path. Specifically, kfsext = Extension('kfs', include_dirs ['kfs/src/cc/', '<path to boost>'])
      
      3 python kfs_setup.py ~/kfs-0.5/build/lib/ build
    
  编译之后,生成共享链接库kfs.so,进行安装:
      1 python kfs_setup.py ~/kfs-0.5/build/lib/ install
    
  如果要安装到一个指定的目录下(如~/kfs-0.5/build/lib),需要设置home选项:
      1 python kfs_setup.py ~/kfs-0.5/build/lib install --home=~/kfs-0.5/build/lib
    
  同时,需要更新PYTHONPATH和LD_LIBRARY_PATH环境变量:
      1 export PYTHONPATH=${PYTHONPATH}:~/kfs-0.5/build/lib/lib64/python
      
      2 export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:~/kfs-0.5/build/lib 
    
  3.启动KFS服务进程
1、 MetaServer
      1 cd ~/kfs-0.5/build/src/cc/meta
      
      2 cp ~/kfs-0.5/conf/MetaServer.prp ./
      
      3 ./metaserver MetaServer.prp
    
  备注:这里需要提前创建MetaServer.prp中指定的和logDir和cpDir目录:./kfslog和./kfscp。
2、ChunkServer
      1 cd~/kfs-0.5/build/src/cc/chunk
      
      2 cp ~/kfs-0.5/conf/ChunkServer.prp ./
      
      3 ./chunkserver ChunkServer.prp
    
  3、KfsClient
      1 cd ~/kfs-0.5/build/src/cc/tools
      
      2 ./kfsshell –s <meta server name> -p <port>
      
      3 ./cptokfs –s <meta server name> -p <port> -d <source path> -k <kfs path>
      
      4 ./cpfromkfs –s <meta server name> -p <port> -d <source path> -k <kfs path>
    
  备注:~/kfs-0.5/build/src/cc/tools目录下有各种API操作工具,如kfsshell、cptokfs、cpfromkfs等,这里没有一一列举。
4.查看和关闭KFS服务进程
1、查看进程
      1 ps –aux | grep metaserver
      
      2 ps –aux | grep chunkserver
      
      3 ps –aux | grep kfsshell
    
  2、关闭进程
      1 kill -9<pid>
    
  5.参考资料
- 
      http://code.google.com/p/kosmosfs/
- 
      http://sourceforge.net/projects/kosmosfs/


 
					 
					