有不少小伙伴在实际工作中,对于如何存储文件(图片、视频、音频等)没有一个很好的解决思路。都明白不能将文件存储在单台服务器的磁盘上,也知道需要将文件进行副本备份。如果自己手动写文件的副本机制,那就太麻烦了,这会涉及冗余副本机制、服务器的调度、副本检测、服务器节点检测、文件副本存放策略、网络环境检测等等一系列的难题。了解Hadoop的小伙伴,会自然而然的想到HDFS,没错,HDFS可以存储文件,也能够将大文件切分成一个个文件块进行存储,还能够根据配置自动提供冗余副本机制,不用我们自己去处理复杂的冗余副本机制,也不用处理服务器的调度、副本检测、服务器节点检测、文件副本存放策略、网络环境检测等等一系列的难题。不过,HDFS适合存储大文件,原因是文件的元数据信息全部存储在NameNode节点中,如果使用HDFS大量的存储小文件,则会使NameNode的内存占用率迅速上升,NameNode节点会成为整个集群环境的瓶颈。
基于种种原因的考虑,今天,我为大家推荐一款高性能的分布式文件系统——FastDFS,FastDFS同样能够提供冗余副本机制,也能够处理上述所说的种种问题。不多说了,我们进入主题吧。
跟踪服务器: 192.168.50.131 (liuyazhuang131) 存储服务器: 192.168.50.132 (liuyazhuang132) 环境: CentOS 6.5 用户: root 数据目录: /fastdfs (注: 数据目录按你的数据盘挂载路径而定)
安装包:
FastDFS v5.05libfastcommon-master.zip(是从 FastDFS 和 FastDHT 中提取出来的公共 C 函数库)fastdfs-nginx-module_v1.16.tar.gznginx-1.6.2.tar.gzfastdfs_client_java._v1.25.tar.gz源码地址: https://github.com/happyfish100/ 下载地址: http://sourceforge.net/projects/fastdfs/files/ 官方论坛: http://bbs.chinaunix.net/forum-240-1.html
(1)上传或下载 libfastcommon-master.zip 到/usr/local/src 目录
(2)解压
# cd /usr/local/src/ # unzip libfastcommon-master.zip # cd libfastcommon-master(3) 编译、安装
# ./make.sh # ./make.sh installlibfastcommon 默认安装到了如下位置。
/usr/lib64/libfastcommon.so /usr/lib64/libfdfsclient.so(4)因为 FastDFS 主程序设置的 lib 目录是/usr/local/lib, 所以需要创建软链接
# ln -s /usr/lib64/libfastcommon.so /usr/local/lib/libfastcommon.so # ln -s /usr/lib64/libfastcommon.so /usr/lib/libfastcommon.so # ln -s /usr/lib64/libfdfsclient.so /usr/local/lib/libfdfsclient.so # ln -s /usr/lib64/libfdfsclient.so /usr/lib/libfdfsclient.so(1)上传或下载 FastDFS 源码包(FastDFS_v5.05.tar.gz) 到 /usr/local/src 目录
(2)解压
# cd /usr/local/src/ # tar -zxvf FastDFS_v5.05.tar.gz # cd FastDFS(3)编译、 安装(编译前要确保已经成功安装了 libfastcommon)
# ./make.sh # ./make.sh install采用默认安装的方式安装,安装后的相应文件与目录:
A、 服务脚本在:
/etc/init.d/fdfs_storaged /etc/init.d/fdfs_trackerB、 配置文件在(样例配置文件)
/etc/fdfs/client.conf.sample /etc/fdfs/storage.conf.sample /etc/fdfs/tracker.conf.sampleC、 命令工具在/usr/bin/目录下的
fdfs_appender_test fdfs_appender_test1 fdfs_append_file fdfs_crc32 fdfs_delete_file fdfs_download_file fdfs_file_info fdfs_monitor fdfs_storaged fdfs_test fdfs_test1 fdfs_trackerd fdfs_upload_appender fdfs_upload_file stop.sh restart.sh(4)因为 FastDFS 服务脚本设置的 bin 目录是/usr/local/bin, 但实际命令安装在/usr/bin, 可以进入/user/bin 目录使用以下命令查看 fdfs 的相关命令:
# cd /usr/bin/ # ls | grep fdfs因此需要修改 FastDFS 服务脚本中相应的命令路径,也就是把/etc/init.d/fdfs_storaged和/etc/init.d/fdfs_trackerd 两个脚本中的/usr/local/bin 修改成/usr/bin:
# vi fdfs_trackerd使用查找替换命令进统一修改:%s+/usr/local/bin+/usr/bin
# vi fdfs_storaged使用查找替换命令进统一修改:%s+/usr/local/bin+/usr/bin
注:使用查找替换命令为进入vi / vim编辑器,按下esc键,输入冒号(:),再输入%s+/usr/local/bin+/usr/bin即可把所有的/usr/local/bin修改为/usr/bin
复制 FastDFS 跟踪器样例配置文件,并重命名:
# cd /etc/fdfs/ # cp tracker.conf.sample tracker.conf修改的内容如下:
disabled=false port=22122 base_path=/fastdfs/tracker(其它参数保留默认配置, 具体配置解释请参考官方文档说明:http://bbs.chinaunix.net/thread-1941456-1-1.html )
添加如下端口行:
-A INPUT -m state --state NEW -m tcp -p tcp --dport 22122 -j ACCEPT重启防火墙
# service iptables restart(初次成功启动,会在/fastdfs/tracker 目录下创建 data、 logs 两个目录)
查看 FastDFS Tracker 是否已成功启动。
# ps -ef | grep fdfs添加以下内容
## FastDFS Tracker /etc/init.d/fdfs_trackerd start复制 FastDFS 存储器样例配置文件,并重命名
# cd /etc/fdfs/ # cp storage.conf.sample storage.conf修改的内容如下:
disabled=false port=23000 base_path=/fastdfs/storage store_path0=/fastdfs/storage tracker_server=192.168.50.131:22122 http.server_port=8888(其它参数保留默认配置, 具体配置解释请参考官方文档说明:http://bbs.chinaunix.net/thread-1941456-1-1.html )
添加如下端口行:
-A INPUT -m state --state NEW -m tcp -p tcp --dport 23000 -j ACCEPT重启防火墙:
# service iptables restart(初次成功启动,会在/fastdfs/storage 目录下创建 data、 logs 两个目录)
查看 FastDFS Storage 是否已成功启动
# ps -ef | grep fdfs添加:
## FastDFS Storage /etc/init.d/fdfs_storaged start返回 ID 号: group1/M00/00/00/wKgEfVUYNYeAb7XFAAVFOL7FJU4.tar.gz(能返回以上文件 ID, 说明文件上传成功)
FastDFS 通过 Tracker 服务器,将文件放在 Storage 服务器存储, 但是同组存储服务器之间需要进入文件复制, 有同步延迟的问题。假设 Tracker 服务器将文件上传到了 192.168.50.132,上传成功后文件 ID已经返回给客户端。此时 FastDFS 存储集群机制会将这个文件同步到同组存储 192.168.50.133,在文件还没有复制完成的情况下,客户端如果用这个文件 ID 在 192.168.50.133 上取文件,就会出现文件无法访问的错误。而 fastdfs-nginx-module 可以重定向文件连接到源服务器取文件,避免客户端由于复制延迟导致的文件无法访问错误。(解压后的 fastdfs-nginx-module 在 nginx 安装时使用)
(注意: 这个路径修改是很重要的,不然在 nginx 编译的时候会报错的)
复制 fastdfs-nginx-module 源码中的配置文件到/etc/fdfs 目录, 并修改
# cp /usr/local/src/fastdfs-nginx-module/src/mod_fastdfs.conf /etc/fdfs/ # vi /etc/fdfs/mod_fastdfs.conf修改以下配置:
connect_timeout=10 base_path=/tmp tracker_server=192.168.50.131:22122 storage_server_port=23000 group_name=group1 url_have_group_name = true store_path0=/fastdfs/storage简洁版 nginx 配置样例:
user root; worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; server { listen 8888; server_name localhost; location ~/group([0-9])/M00 { #alias /fastdfs/storage/data; ngx_fastdfs_module; } error_page 500 502 503 504 /50x.html; location = /50x.html { root html; } } }注意、 说明: A、 8888 端口值是要与/etc/fdfs/storage.conf 中的 http.server_port=8888 相对应,因为 http.server_port 默认为 8888,如果想改成 80,则要对应修改过来。 B、 Storage 对应有多个 group 的情况下,访问路径带 group 名,如/group1/M00/00/00/xxx,对应的 Nginx 配置为:
location ~/group([0-9])/M00 { ngx_fastdfs_module; }C、 如查下载时如发现老报 404, 将 nginx.conf 第一行 user nobody 修改为 user root 后重新启动。
添加:
-A INPUT -m state --state NEW -m tcp -p tcp --dport 8888 -j ACCEPT重启防火墙
# service iptables restart启动成功后会输入:
ngx_http_fastdfs_set pid=xxx(重启 Nginx 的命令为: /usr/local/nginx/sbin/nginx -s reload)
http://192.168.50.132:8888/group1/M00/00/00/wKgyhFkWubGAcwrWAAVFOL7FJU4.tar.gz 注意: 千万不要使用 kill -9 命令强杀 FastDFS 进程,否则可能会导致 binlog 数据丢失。另外,大家可以到链接http://download.csdn.net/detail/l1028386804/9841444下载FastDFS_v5.05_安装包、工具包
好了,咱们今天就聊到这儿吧!别忘了给个在看和转发,让更多的人看到,一起学习一起进步!!
如果觉得文章对你有点帮助,请微信搜索并关注「 冰河技术 」微信公众号,跟冰河学习分布式存储技术。
冰河 『冰河技术』公号 作者 认证博客专家 分布式与微服务 大数据与云计算 云原生 微信搜一搜【冰河技术】微信公众号,关注这个有深度的程序员,每天阅读超硬核技术干货,公众号内回复【PDF】有我准备的一线大厂面试资料和我原创的超硬核PDF技术文档,以及我为大家精心准备的多套简历模板(不断更新中),希望大家都能找到心仪的工作,学习是一条时而郁郁寡欢,时而开怀大笑的路,加油。如果你通过努力成功进入到了心仪的公司,一定不要懈怠放松,职场成长和新技术学习一样,不进则退。如果有幸我们江湖再见!