Вы находитесь на странице: 1из 9

陈  茫  周力青  郑  聪:图书馆廉价私有云存储的构建及性能研究

Chen Mang, Zhou Liqing, Zheng Cong: The Research on Construction and Performance of Library’s Cheap Private Cloud Storage   85

图书馆廉价私有云存储的构建及性能研究*
陈  茫1  周力青1  郑  聪2
(1 桂林理工大学图书馆; 2 桂林理工大学信息科学与工程学院)

摘  要  以基于Hadoop的随书光盘管理系统云平台为例,从廉价云存储的构架、实证研究与核心
技术实施、相关测试与性能分析等三方面,阐述图书馆廉价私有云存储的构建及性能。为图书馆
实现廉价的私有云服务提供一个可行的指导方案。
关键词  随书光盘系统  Hadoop  私有云  云计算

DOI: 10.13663/j.cnki.lj.2015.02.016

The Research on Construction and Performance of Library’s


Cheap Private Cloud Storage
Chen Mang1, Zhou Liqing1, Zheng Cong2 (1 Guilin University of Technology Library; 2 Guilin
University of Technology College of Information Science and Engineering)

Abstract  This paper discusses the construction and performance of libraries’ cheap private cloud
storage, including the cheap cloud storage architecture, empirical research and the core technology of
implementation, and the related testing and performance analysis. Taking CD-Book management system
of Hadoop cloud platform for example, this paper provide a viable solution for libraries in utilizing cheap
private cloud services
Key words  CD-BOOK system, Hadoop, Private cloud, Cloud computing

0  引言 的利用效率 [4]。
互联网的飞速发展和信息技术的巨大变 本文正是基于上述的背景问题,利用免费
革,带来了各种信息数据的数字化狂潮,信息 的、 开 源 的 云 计 算 构 架 和 管 理 工 具 ——
数据一直以我们无法想象的速度迅猛增长着。 Hadoop,结合随书光盘应用服务系统,建立随
“云计算”给图书馆的管理和服务带来了巨大 书光盘系统 Hadoop 云平台;并对廉价云存储
[1] [2-3]
的机遇和挑战 ,“云 计 算 ” 时代已然来 构建的相关特点和优势、具体构架、关键技术
到,它也是现今最时髦的词汇。如何运用云计 体系、具体的实验环境、核心技术的实施、相
算技术,走进和融入用户的生活,为广大读者 关的测试和性能分析等方面进行研 究。
提供快捷、高效和安全的数字信息服务,让他
们随时随地、无障碍地感受到信息服务的方便 1  相关研究
和快捷,具有重要的现实意义,也是图书馆研 1.1  基本概念及国内外研究现状
究领域中一个值得研究的重要课题。然而,作 所谓的云,即面向网络的、可配置的共享
为数字图书馆的研究人员,面对现有信息管理 计算资源池,能进行方便、快捷、按需访问的
系统的数字资源存储时,却始终无法回避两个
 本 文系广西哲学社会科学规划 2013 年度研究课
*
难题:(1)如何能用最小的资源消耗代价,最
题基金项目“基于 HADOOP 大数据技术分布式信
大限度的满足用户的实际需求;(2)如何减少 息检索系统的研究与实现” (项目编号:13FTQ003)
设备的经费和管理的成本,同时提高数据存储 的研究成果之一。
86  ·新技术应用· 图书馆杂志(2015年第2期  总第286期)
  Library Journal(Vol.34.No.2)

一种服务模式;其中共享资源计算池是指服务 2.1  相关特点和优势


器、存储、应用、网络和服务等资源,这些资 (1)海量存储与动态扩展。基于云计算构
源池能以最小化的方式进行管理并实现用户和 架的云存储技术,其分布式文件系统能够轻松
服务提供者之间交互的快速提供和释放。云倡 地实现大规模数据的海量存储与动态扩 展。
导的是一种软件即服务(SaaS)、平台即服务 (2)复杂数据类型的虚拟化存储。采用数
(PaaS)和基础设施及服务(Iaas)的理念,通 据的虚拟化技术和云存储数据管理技术,能实
过私有云、社区云、公共云和混合云等实现云 现复杂数据类型的虚拟化存储。特别是,诸
服务模式的部 署。 如:古籍文献、特藏文献、多媒体资源、电子
通过相关文献分析,不难发现:(1)从研 期刊、图片资源、音视频资源、随书光盘和自
究内容看,国内外的专家学者研究的主要内容 建的特殊资源等数 据。
集中在以下几个方面:①国内外有关云计算状 (3)高效安全的数据存储。云存储可以部
况阐述;②云存储对未来的问题、机遇、挑 署在不同的地域,通过虚拟化技术实现多存储
战等叙述;③相关应用领域的应用分析介绍; 设备、多应用和多服务协调的共享存储构架。
④云平台的设计与构建;⑤实例分析和介绍; 借助稳定高效的传输网络,轻松地实现数据的
(2) 从相关对比来看,国内的研究虽然起步落 存储过程,提高存储的效率。特别是当发生不
后于国外,但是发展的势头要好于国外,并且 可预测的数据灾难时,云存储的分布式备份功
研究的方向和范围也较为发散,同时国内外的 能,可以实现数据的快速恢复,从而确保数据
研究侧重有很明显的差异 。 的安 全。
1.2  主要的应用案例 (4)低廉的服务与管理成本。云存储具有
目 前, 常 用 的、 稳 定 的、 开 源 的 且 免 费 服务与管理成本低廉的特性,文章 [16] 已有详
的 云 计 算 应 用 管 理 工 具 有:Hadoop[5-7]、Open 细的论述,在这里就不再详述了。通过构建合
Nebula[8]、Eucalyptus[9] 和 OpenStack[10] 等。 根 据 理的云存储的方式,可以减少购买专用存储的
自身的需求选用相应的云管理工具,能快速 经费支出、系统服务、管理和维护的成 本。
地部署和构架云存储环境。其实际应用案例 2.2  Hadoop 廉价云存储的构架 [17]
有: ① 亚 马 逊 公 司 的 云 存 储 S3[11], 它 是 云 存 Hadoop 廉价私有云存储的基本构架是一个
储解决方案可行性应用的先驱,其云存储的数 通用的、可行的、可操作的、廉价的云存储构
据存储速率可根据用户的数据量和用户需求 架。它具有普适性,使用者能根据自身业务系
而定;②  美国国会图书馆与 DuraSpace 公司的 统或应用系统的特点迁移和组建所需的云服务
[12-13]
DuraCloud 项目 ,它为广大的数字图书馆用 平台。本文构建的随书光盘系统 Hadoop 云平
户提供了一个可实现的有效保存与访问的解决 台,如下图 1 所示,其核心的组件和模块描述
[14]
方案;③百度公司的“百度云” 、杭州格畅 如 下:
科技的“格子云 2.0”[15] 等都是不错的公共云 (1) 虚 拟 机(Virtual Machine): 缩 写 为
存储设施。这些具体的云存储实施方案,既提 VM,指通过软件模拟的、具有完整硬件系统功
供了可行的云存储应用环境,又使构建符合自 能的、运行在一个完全隔离环境中的完整计算
身需求的图书馆应用服务系统的云存储成为了  机系 统。
可 能。 (2) 虚 拟 机 管 理 器 模 块(Virtual Machine
Manager Module):缩写为 VMMM,是 VMM 实
2  基于随书光盘系统的廉价云存储构建 现的中枢,所有其他 VMM 组件通过它进行数
本文研究的是图书馆廉价私有云存储的构 据的交互及通信,它运行命令、传输文件并控
建,从云平台的相关特点和优势、Hadoop 廉价 制其他 VMM 组件和所有虚拟主机及 VMM 库服
云存储的构架、功能模块架构和相关技术体系 务器的通 信。
组成着手研 究。 (3)数据库访问模块(Data Access Module):
陈  茫  周力青  郑  聪:图书馆廉价私有云存储的构建及性能研究
Chen Mang, Zhou Liqing, Zheng Cong: The Research on Construction and Performance of Library’s Cheap Private Cloud Storage   87

图 1  Hadoop 廉价私有云存储构架图

图 2  功能模块架构图

缩写为 DAM,主要是负责数据的访问,简单的 (5)负载均衡器(Load Manager):缩写为


说法就是实现对数据表的 Select(查询)
,Insert LM,这里它是负责随时监视发生在私有云上的
(插 入 )
,Update(更 新 )
,Delete(删 除 ) 等 操 负载状 况。
作。虚拟机所需的虚拟磁盘空间通过数据访问 (6) 分 布 式 云 存 储(Distributed Storage on
接口模块(Data Access Module Interface,以下缩 the Cloud):缩写为 DISOC,这是一个基于 Web
写为 DAM-I)获得,并通过 DAM-I 调用 DAM, 的网络文件云存储系统,它是云存储构架的
DAM 则负责整个云存储服务器上的文件分配、 实 例。
检索及存 储。 2.3  功能模块架构
(4)负载均衡模块(Load Balancer Module): 随书光盘系统 Hadoop 云平台主要有前台
缩写为 LBM,将负载(工作任务)进行平衡、 读者用户功能模块和后台系统功能模块两大部
分摊到多个操作单元上进行执行,从而共同完 分组成。
(1)前台读者用户功能模块,主要由:
成工作任务。这里主要是指分配负载在不同虚 数据资源展示、一站式检索服务、类别分类获
拟机所组成的实例化物理服务器的私有 云。 取、中图分类法获取、下载排行推荐和最新发
88  ·新技术应用· 图书馆杂志(2015年第2期  总第286期)
  Library Journal(Vol.34.No.2)

布推荐等六大子模块构成;(2)后台系统功能 务应用和资源交互获 取。
模块,主要由:系统管理、监控管理、云计算 (2)应用接口层。根据图书馆内不同的业
管理和虚拟资源管理后台等四大子模块组成。 务类型,针对应用服务的接口,运用相应的技
其具体的功能模块构架,如图 2 所 示。 术手段,为用户提供不同的应用服务。其技术
2.4  相关技术体系组成 组成,主要由网络接入技术、用户认证技术、
基于云计算技术的云存储技术体系构成涉 权限管理技术、异构平台协同技术、资源服务
及的技术领域也非常广泛,它不是单一的、独 协同技术、服务生命周期设计技术、优化配置
立的技术应用,而是系统的、复杂的技术体系 技术和负载均衡技术等组 成。
构成,其具体的体系构成,如下图 3 所 示。 (3)基础管理层。该部分是整个技术体系
(1) 用 户 访 问 层。 通 过 通 用 终 端 显 示 技 的核心部分,负责整个云存储的数据存储系统
术、移动用户界面显示技术、访问导航技术、 的管理,其设计的好坏直接决定云存储的数据
日志记录技术、资源服务推荐技术、远程共享 安全和数据存储效率的成败 [18]。其涉及的主要
技术、在线存储技术和个性界面定制技术等, 技术有:分布式文件管理技术、存储集群管理
实现在云存储业务管理、维护、操作的智能服 技术、内容分发技术、数据删冗与压缩技术、

图 3  云存储技术体系构成

图 4  网路拓扑结构
陈  茫  周力青  郑  聪:图书馆廉价私有云存储的构建及性能研究
Chen Mang, Zhou Liqing, Zheng Cong: The Research on Construction and Performance of Library’s Cheap Private Cloud Storage   89
数据加密技术、数据备份技术和数据容灾技 ………
术 等。 172.16.24.64 hadooptest7.gutlib
(4)物理存储层。云存储的物理介质可以 172.16.24.155 hadooptest1.gutlib
存放在不同地域,通过互联网络进行设备互 (2) 第 二 步, 设 置 各 个 节 点 间 的 安 全 访
联,在设备在线扩展技术、设备在线收缩技 问。RHEL 自带 SSH 软件包,也可通过 SSH 进
术、大规模数据存储技术、结构化或非机构化 行命令安装,如下代码 2 所 示。
数据存储技术、存储虚拟化技术、存储集中管 // 代码 2 安全访问设置
理技术和状态监控技术等技术的支撑下,实现 $ sudo yum install ssh // 安装 SSH
面向服务的分布式的数据管 理。 $ ssh-keygen –t rsa // 分发密钥到各节点
$ ssh-copy-id-I id_rsa.pub hadooptest1.gutlib
3  实证研究与核心技术分析 ……
3.1  实验环境设置 [19] $ ssh-copy-id-I id_rsa.pub hadooptest7.gutlib
本文实验的随书光盘系统 Hadoop 云平台 (3) 第 三 步, 在 Namenode 和 Datanode 上
环境,其网路拓扑结构如图 4 所示,主要由以 分别安装 Hadoop 软件包,并配置 core-site.xml/
下 3 个部分组 成: hdfs-site.xml/mapred-site.xml 三个文件,将事先
(1)应用服务系统:名称:CDBOOK 随书 定好的 Namenode 主机名和 Datanode 主机名填
光盘管理系统 | 网址:http://202.193.80.185 | 数 入相应的位 置。
据总量:5TB | 光盘总数:12 707 种 | 网站访问 (4) 第 四 步, 配 置 HA 节 点。HA(High
量:384 027 人次,下载总量:4 245 796 次(数 Availability) 是 Hadoop2.x 以 后 版 本 才 有 的
据统计截止为 2014 年 3 月 20 日)。 特 性, 它 有 效 的 解 决 了 Namenode 单 节 点 故
(2)硬件存储设备:8 台 Think Station D20 障 无 法 快 速 恢 复 的 问 题。 其 实 现 原 理 是 对
工作电脑,EMC2 存储陈列,具体的参数配置 Namenode 进 行 实 时 备 份, 并 在 Namenode 节
在第五部分有描 述。 点 发 生 宕 机 后 将 Namenode 服 务 无 缝 迁 移 到
(3) 开 发 平 台:Hadoop2.2.0 开 源 分 布 式 HA 节点上。其完整的配置信息,如下代码 3 
计 算 平 台, 由 HDFS、MapReduce、HBase 和 所 示。
Zookeeper 等子项目组 成。 // 代码 3  HA 配置
3.2  核心技术实施 <configuration>
随书光盘系统 Hadoop 云平台,是随书光       <property>
盘管理系统与云存储服务技术的重新整合,是         <name>dfs.replication</name>
云计算技术在应用服务系统中的硬件部署、权         <value>3</value>
限管理、数据处理和负载均衡等方面的云计算         <description> 配置文件备份数 </description>
技术创 新。       </property>
3.2.1  云存储的部署       <property>
(1)第一步,建立各个节点计算机的初步         <name>dfs.nameservices</name>
通信。编辑 Hadoop 软件框架中的 /etc/hosts 文         <value>hadoopgutlib</value>
件,修改配置,如下命令代码 1 所示,并使用         <description> 配 置 HA 命 名 空 间 
ping 命令测试各个节点的连通性,从而确保各 </description>
个节点的通 信。 </property>
// 代码 1 通信连通测试 <property>
127.0.0.1 localhost         <name>dfs.ha.namenodes</name>
172.16.24.58 hadooptest1.gutlib         <value>hadooptest1.gutlib,hadooptest2.
172.16.24.59 hadooptest2.gutlib gutlib</value>
90  ·新技术应用· 图书馆杂志(2015年第2期  总第286期)
  Library Journal(Vol.34.No.2)

图 5  随书光盘系统 Hadoop 云平台数据处理流程图

        <description> 配置 HA 节点 </description> <value>true</value>


</property> // 配置${HADOOP_CONF_DIR}/hadoop-policy.xml
</configuration> // 提交作业
3.2.2  权限管理 $HADOOP_HOME/bin/hadoop jar wordcount.
在 随 书 光 盘 系 统 Hadoop 云 平 台 的 环 境 jar wordcount\
下,通过用户分组管理模块和作业管理模块 -D mapred.map.tasks=1\
来实现相关的权限管理。实现权限管理需要 -D mapred.reduce.tasks=1\
用 到 Hadoop 中 的 Fair Scheduler 或 者 Capacity -D mapred.job.queue.name=infrastructure\
Scheduler 工具来实 现。 Input output
(1)用户分组管理模块。该模块用于按组 3.2.3  数据处理
为单位组织管理,用户只能向固定的组来提 随书光盘系统 Hadoop 云平台的数据处理
交作业,只能使用固定分组中所有配置的资 流 程 分 为 两 个 部 分, 如 图 5 所 示, 具 体 流 程
源;同时,可以限制相关用户提交的作业数 为:(1)基于 HBase 的查询索引,接收和处理
和 资 源 量 等。 以 Fair Scheduler 为 例, 具 体 实  用 户 的 数 据 光 盘 查 询 请 求, 然 后 到 HBase 中
现 为: 完成具体的查询处理,获得数据查询记录列表
①  将 Fair Scheduler 的 jar 包复制到 lib 中。 后,在到 HDFS 中完成数据文件的读取或者存
cp${HADOOP_HOME}/contrib/fairscheduler/ 储,并最后反馈给读者用户。(2)数据文件的
hadoop-fairscheduler-0.20.0+320.jar${ HADOOP_ 读取和 HBase 的查询索引创建。设置一个主节
HOME }/lib/ 点用于检测 HDFS 的新数据文件,并将该文件
②  配置 Queue 信 息。 分发给不同的子节点完成查询索引创建,并将
③  配置 fair scheduler 信 息。 记录对应的索引数据插入到 HBase 中。
④  创建 fair-scheduler.xml 文 件。 3.2.4  负载均衡
(2) 作 业 管 理 模 块。 该 模 块 包 括: 作 业 随 书 光 盘 系 统 Hadoop 云 平 台 可 以 使 用
提交权限控制、作业运行状态查看、作业修 ZooKeeper 工具来实现整个系统存储和协调关
改、作业删除等权限的控制。其具体的功能由 键共享状态的协同工作,从而确保系统的负载
Hadoop 中的 ACL 完成,实现 为: 均衡。ZooKeeper 是分布式应用的分布式协作服
// 配置 core-site.xml 中的属性 务,其目的是为了减轻分布式应用从开发协作
<name>hadoop.security.authorization</name> 服务的负担和实现系统的负载均衡;它具有简
陈  茫  周力青  郑  聪:图书馆廉价私有云存储的构建及性能研究
Chen Mang, Zhou Liqing, Zheng Cong: The Research on Construction and Performance of Library’s Cheap Private Cloud Storage   91
单、表述清晰、可用性强和简单化的松耦合交 4  相关测试与性能分析
互的特点。其具体实现代码 为: 4.1  测试硬件参数对比
// 创建一个 Zookeeper 实例与服务器的连接 在本文的测试过程中,涉及两个不同的硬
ZooKeeper zk = new ZooKeeper 件存储设备之间的性能对比,其相关的参数如
("172.16.24.155:2181",500000,new Watcher() 下表 1 所 示。
{ // 监控所有被触发的事件 4.2  网络访问宽带能力
public void process(WatchedEvent event) 利用 Hadoop 平台的 Slive Test 工具对私有
{ 云的网络数据访问能力进行测试,测试代码如
//dosomething 下:$ hadoop org.apache.hadoop.fs.slive.SliveTest
} -read 50 -write 50。其测试原理是:利用接口对
}); HDFS 的文件进行相应的操作,从而测试出云
// 创建一个目录节点 平台在读写文件时的网络吞吐能力。本项目的
zk.create("/root","mydata".getBytes read、write 操作各占 50% 的基准测试。单台专
(),Ids.OPEN_ACL_UNSAFE,CreateMode. 有存储设备其 100 MB/S 网络的理论最高带宽为
PERSISTENT); 10 MB/S,云平台的带宽测试结果最高为 74.2
// 创建一个子目录节点 MB/S,大大的突破了 10 MB/S 的理论值,如下
zk.create("/root/childone","childone". 图 6 所示,是运行上述测试指令后 40 分钟左
g e t B y t e s ( ), I d s . O P E N _ A C L _ U N S A F E , 右持续读写该平台的网络状态图 示。
CreateMode. PERSISTENT ); 4.3  负载能力
// 取得目录节点的列表 利 用 Autobench[20-21] 工 具 结 合 httperf 命 令
zk.getChildren("/root",true); 对 Web 服务器的负载能力进行测试,能得出该
// 取得子目录节点节点下的数据 服务器可以承载的最大并发连接数与最佳并发
zk.getData("/root/childone",true,null); 数。测试结果,如下图 7 所 示。
// 修改节点子目录节点下的数据 测 试 命 令 为:# autobench --single_host--
zk.setData("/root/childone", host1=172.16.24.155:2181 --port1=80 --uri1=/
"childonemodify".getBytes(),-1); logo.gif --quiet --low_rate=50 --high_rate=1500-- 
// 删除子目录节点这个节点 rate_step=50 --num_call=1 --num_conn=2000 -- 
zk.delete("/root/childone",-1); timeout=10 --file /tmp/result.tsv。
// 关闭 session 4.4  小结
zk.close(); 通过分析对比,不难发现构建的随书光盘

表 1  硬件存储设备的相关参数对比表

序  号 项    目 廉价私有云存储 专业数据存储
1 型    号 Think Station D20 EMC2 存储阵列
2 台    数 8台 1台
CPU:Xeon E5645 12*2.4GHz*5 CPU:Xeon E7 4280 24*2.0GHz
3 参    数
内存:8GB 1333 ECC 内存:32GB 1333 ECC
4 操作系统 RHEL 6.3 Win2008 r2
5 容    量 4TB * 8 = 32TB 24TB
6 价    值 较廉价 昂贵
7 容量扩展 能 不能
8 网    络 100 M 100 M
92  ·新技术应用· 图书馆杂志(2015年第2期  总第286期)
  Library Journal(Vol.34.No.2)

图 6  Slive Test 工具测试 Hadoop 平台的网络访问带宽图

图 7  Autobench 工具测试云存储和单台服务器的负载能力图

系统的 Hadoop 云平台比 EMC2 专业存储设备, 本文针对现有的随书光盘系统 Hadoop 云平台,


在硬件配置总体相差不大的情况下,有如下优 以实证的角度,从云存储构架、技术体系构
势:(1)云平台构建的成本比 EMC2 专业存储 成、云存储性能等方面做出深入的研究。由于
设备的价格更加低廉;(2)云平台的网络吞吐 随书光盘系统 Hadoop 云平台具有普适性,不
能力比 EMC2 专业存储设备的大大提高,能够 仅能应用于随书光盘系统,而且能够向其他的
更快的处理随书光盘的数据上传和下载;(3) 图书馆应用服务系统,进行相应的云存储应用
在较多并发数的用户情况下,云平台的数据负 迁移和扩展,进而能全面有效的提高图书馆的
载能力大大提高,特别测试的最后,EMC2 专 信息服务水平和能 力。
业存储设备已经无法完成测试的请求,然而云 最后,本文的研究也难免存在不足之处,
平台却能出乎意料的变现更好的负载能力。总 在今后的工作中,笔者也将进一步的从以下几
之,随书光盘系统 Hadoop 云平台具有成本低、 个方面来进行改进和完善:①根据随书光盘系
速度快、负载能力强等特点,能更好的为用户 统 Hadoop 云平台在具体应用过程中出现的问
提供方便、快捷、高效和稳定的信息服 务。 题,确立更加科学的云构架的选型和应用,完
善云平台的功能;②改进云存储的相关流程,
5  结论 进一步提高云存储的安全性和存储效率。总
针对现有的图书馆应用服务系统的云存储 之,云计算技术在图书馆的应用,是图书馆信
实现方式,作为当今社会信息技术的重要力量 息服务发展的必然趋势,图书馆在云计算时代
之一,正引发整个图书馆界存储方式的革命。 大有可 为。
陈  茫  周力青  郑  聪:图书馆廉价私有云存储的构建及性能研究
Chen Mang, Zhou Liqing, Zheng Cong: The Research on Construction and Performance of Library’s Cheap Private Cloud Storage   93
参考文献 [14] 百度云 [EB/OL]. [2014-03-20]. http: //yun. baidu.
[1] 胡小菁, 范并思. 云计算给图书馆管理带来挑战 com/1t? =home .
[J]. 大学图书馆学报, 2009(4): 7-12. [15] 格子云2. 0 [EB/OL]. [2014-03-20]. http: //www.
[2] Y a n H a n . O n t h e C l o u d s : A N e w W a y o f gleasy. com/.
Computing[J]. Information Technology &Libraries, [16] 张兴旺, 李晨晖, 秦晓珠. 构建于廉价计算机集
2010, 29(2): 87-92. 群上的云存储的研究与初步实现[J]. 情报杂志,
[3] Tom Ipr. Where the Cloud Meets the Commons[J]. 2011(11): 166-171, 182.
Journal of Web Librarianship, 2011(2): 132-41. [17] 于秀芬, 张曾昱. 基于云存储构架的随书光盘
[4] 胡昌平, 谷斌. 数字图书馆建设及其业务拓展战 镜像服务器构建探讨[J]. 图书馆杂志, 2011(2):
略——国家可持续发展中的图书情报战略分析 72-76.
(4)[J]. 中国图书馆学报, 2005(5): 13-16, 33. [18] 杜海宁. 基于云计算的图书馆海量数据存储研究
[5] 刘鹏, 黄宜华, 陈卫卫, 等. 实战Hadoop——开启 [J]. 图书与情报, 2010(3): 99-101.
通向云计算的捷径[M]. 北京: 电子工业出版社, [19] 刘晓刚, 张红. 基于开源云计算的图书资料信息
2011: 2-34. 系统探究[J]. 情报科学, 2011(6): 906-909, 923.
[6] Hadoop名字的起源 [EB/OL]. [2014-03-20]. http: [20] Hussam Abu-Libdeh, Lonnie Princehouse, and
//zh. wikipedia. org/wiki/Apache_Hadoop. Hakim Weatherspoon. RACS: A Case for Cloud
[7] 姚宏宇, 田朔宁. 云计算——大数据时代的系统 Storage Diversity[C]. In Proceedings of the 1st ACM
工程[M]. 北京: 电子工业出版社. 2013: 99-102. Symposium on Cloud Computing. New York: ACM,
[8] Open Nebula Project [EB/OL]. [2014-03-20]. http: 2010: 29-40.
//opennebula. org/. [21] 赫建营, 晏海华, 刘超, 等. 一种有效的Web性能
[9] Eucalyptus Cloud [EB/OL]. [2014-03-20]. http: // 测试方法及其应用[J]. 计算机应用研究, 2007(1):
www. eucalyptus. com/. 275-277, 285.
[10] Open source software for building private and
public clouds [EB/OL]. [2014-03-20]. http: //www. 陈  茫  桂林理工大学图书馆,信息中心副主任,馆
openstack. org/. 员。从事移动图书馆、大数据、云计算、数据库技
[11] Jose L Gonzalez, Ricardo Marcelin-Jimenez. 术等方面的研究。E-mail:cmxyz@sina.com  广西桂
Phoenix: A Fault-Tolerant Distributed Web Storage 林  541004
Based on URLs[C]. In Proceedings of the IEEE 9th 周力青  桂林理工大学图书馆,副馆长,研究馆员。
International Symposium on Parallel and Distributed 从事数据库技术、信息管理、数字图书馆等研究。 
Processing with Applications. ISPA. 2011: 282-87. 广西桂林  541004
[12] What is Dura Cloud? [EB/OL]. [2014-03-20]. http: 郑  聪  桂林理工大学信息科学与工程学院,硕士研
//www. duracloud. org/tour. 究生在读。主要从事大数据、云计算、数据库等研
[13] 高建秀, 吴振新, 孙硕. 云存储在数字资源长期保 究。  广西桂林  541004
存中的应用探讨[J]. 现代图书情报技术, 2010(6):
1-6. (收稿日期:2014-03-23 )

(上接第62页)

[23] V i r i d i a n d i g i t a l l i b r a r y s y s t e m [ E B / O L ] . [28] 马 斯 洛 需 求 层 次 理 论 . 百 度 百 科 [ E B / O L ] .
[2013-11-21]. http: //veridiansoftware. com/. [2014-01-20]. http: //baike. baidu. com/
[24] Audrey Watters. National Library of Finland view/690053. htm.
Turns to Crowdsourcing, Games to Help Digitize [29] 孙捷, 宋福根, 陈惠兰. 基于众包模式的导航库系
Its Archives[EB/OL]. [2013-11-21]. http: //www. 统构建的探讨[J]. 图书馆杂志, 2012(9): 38-41.
readwriteweb. com/archives/national_library_of_
finland_turns_to_crowdsourcing. php. 关富英  女,硕士,北京师范大学图书馆,馆员。 
[25] 黄敏, 都平平. Lib2. 0用户参与激励机制初探[J]. E-mail:guanfy@lib.bnu.edu.cn  北京  100875
国家图书馆学刊, 2010(2): 60-65. 李 书 宁   博 士 , 北 京 师 范 大 学 图 书 馆 , 副 研 究 馆
[26] 杨锦. Web2. 0环境下提高高校图书馆信息服务 员。  北京  100875
质量的研究[D]. 北京: 中国石油大学, 2011.
[27] Transcribe Benthem. Help: User levels[EB/OL]. (收稿日期:2014-04-19)
[2014-02-19]. http: //www. transcribe-bentham. da.
ulcc. ac. uk/td/Help: User_levels.

Вам также может понравиться