尽管云计较这一术语并不新奇(Amazon在2006年就瞥绶供给它的云处事),但年夜2008年起它才起头真正成为风行词,这时代,Google和 Amazon的云处事逐渐获得了公家的关注。 Google的App Engine使用户能够在Google基本行动措施上构建和托管 Web 应用轨范。 连同S3,AmazonWeb Services还搜罗Elastic Cloud Compute (EC2)计较Web处事,该处事可以在Amazon的基本行动措施上托管应用轨范。其他公司也起头捋臂张拳,筹备与Amazon和Google一决高下,其中就搜罗 Microsoft?的 Azure,甚至 Sun Microsystems(其云计较还没有正式推向市场)也想分一杯羹。例如IBM比来公布揭晓,它将供给某些产物供开发人员在AmazonEC2 情形中使用。( ]9 F9 M: W' i
AmazonSimple Storage Service (S3)是一个公开的处事,Web应用轨范开发人员可以使用它存储数字资产,搜罗图片、视频、音乐和文档。S3供给一个 RESTful API以编程体例实现与该处事的交互。经由过程本文,您将体味若何使用开源的JetS3t库操作Amazon的S3云处事存储和检索数据。
; B8 S3 }2 a; T" M8 k( k9 ]+ j5 D面向开源的S3云平台介绍 # O( ]" _# T8 G' N5 @$ {
云是一个抽象的概念,暗示松散毗连在一路的计较机组,这些计较机配合执行某项使命或者处事,就像是使用一个零丁的实体完成一样。此概念背后的架构也很抽象:每个云供给者都可以按照各自情形随意设计它的产物。软件即处事(Software as a Service,SaaS)是一个与云相关的概念,暗示云向用户供给某种处事。云模子可以降低用户成本,因为他们无需采办软件和硬件也可以运行 — 处事供给者已经为用户供给了需要的组件。
% u, Y; `5 d' ]- y7 V. \' b 以Amazon的S3产物为例。顾名思义,这是一个公开的处事,使 Web 开发人员能够存储数字资产(如图片、视频、音乐和文档等),以便在应用轨范中使用。使用S3时,它就像一个位于 Internet 的机械,有一个包含数字资产的硬盘驱动。现实上,它涉及到良多机械(位于各个地舆位置),其中包含数字资产(或者数字资产的某些部门)。Amazon还措置所有复杂的处事请求,可以存储数据并检索数据。您只需要付少量的费用(年夜约每月 15 美分 /GB)就可以在Amazon的处事器上存储数据,1 美元即可经由过程Amazon处事器传输数据。* _; {# }1 ]8 _$ [$ k8 k
Amazon的S3处事没有一再开发,它公开了RESTful API,使您能够使用任何撑持 HTTP 通信的说话访谒S3。 JetS3t项目是一个开源Java库,可以抽象出使用S3的RESTful API的细节,将API公开为常见的Java体例和类。编写的代码越少越好,莫非不是吗?充实操作其他人的成不美观也是不错的。在本文中您将看到,JetS3t使S3和Java说话的工作变得加倍简单,年夜根柢上提高了效率。
, _$ G3 v; S( G2 D5 @, CS3开阅暌功用模式介绍 2 y) r ~% h5 u, y1 u
理论上,S3是一个全球存储区域收集(SAN),它默示为一个超年夜的硬盘,您可以在其中存储和检索数字资产。可是,年夜手艺上讲,Amazon的架构有一些分歧。您经由过程S3存储和检索的资产被称为对象。对象存储在存储段(bucket)中。您可以用硬盘进行类比:对象就像是文件,存储段就像是文件夹(或目录)。与硬盘一样,对象和存储段也可以经由过程统一资本标识符(Uniform Resource Identifier,URI)查找。5 s( Z0 O/ e5 i, H" r' t
例如,在我的硬盘中,我有一个名为 whitepaper.pdf 的文件,它位于主目录中名为 documents 的文件夹中。响应的,该pdf文件的URI为/home/aglover/documents/whitepaper.pdf 。在S3中,URI有一点分歧。首先,存储段只能是顶级的 — 无法像嵌套硬盘中的文件夹(或目录)一样进行嵌套。其次,存储段必需遵循 Internet 命名法例;句点旁边没有斜杠,名称不搜罗下划线等等。最后,因为存储段名称已经是Amazon域内的 (s3.amazonaws.com) 公共URI的一部门,存储段名称必需在所有S3中是惟一的。(好动静是每个帐户只能包含 100 个存储段,是以不用担忧别人占用了所有的好名字)。
8 N/ K9 M8 F( {% D2 Y' d5 `) j 存储段在S3中是URI的根。也就是说,存储段的名称将是指向S3中某个对象的URI的一部门。例如,如不美观我有一个名为 agdocs 的存储段以及一个名为 whitepaper.pdf 的对象,URI将是:http://agdocs.s3.amazonaws.com/whitepaper.pdf 。, Q+ E2 }. |' w: T! O$ D9 A
S3还供给了指定存储段和对象的所有者和权限的能力,就像看待硬件的文件和文件夹一样。在S3中界说对象或存储段时,您可以指定一个访谒节制策略,注明谁可以访谒您的S3资产以及若何访谒(例如,读和写权限)。响应地,您可以经由过程良多体例供给对您的对象的访谒,使用RESTful API只是其一一种。0 X* \7 f0 j7 s& C& C3 A
, Z, D# w4 W: K! Y- t% A& x9 `& E
这里Amazon有一个神奇的DNS魔术,用户不用担忧S3资产的 URL 。经由过程 Domain Name System (DNS) 和 CNAME(canonical name的缩写)记实,您可以将自界说水平更高的 URL 映射到S3的 URL 。这样一来,您就潜匿了您(或您的应用轨范)依靠S3的事实! |