月浏览量" />
当前位置:首页 >> 互联网 >> 2006年11月6日

"Times New Roman", Times, serif; align="center">Craigslist 数据库架构

推荐者:草根帮主 (积分 142071) | 原作者:
Craigslist 绝对 互联网 一个传奇公司. 根据以前 一则报道:

每月超过 1000 万人使用该站服务, 月浏览量超过 30 亿次, (Craigslist每月新增 帖子近 10 亿条??)网站 网页数量在以每年近百倍 速度增长. Craigslist 至今却只有 18 名员工(现在可能会多一些了).

Tim O'reilly 采访了 Craigslist Eric Scheide , 于 通过这篇 Database War Stories #5: craigslist 我们能了解一下 Craigslist 数据库架构以及数据量信息.

数据库软件使用 MySQL . 充分发挥 MySQL 能力, 数据库都使用 64 位 Linux 服务器, 14 块 本地磁盘(72*14=1T ?), 16G 内存.

不同 服务使用不同方式 数据库集群.

论坛
1 主(master) 1 从(slave). Slave 大多用于备份. myIsam 表. 索引达到 17G. 大 表接近 4200 万行.

分类信息
1 主 12 从. Slave 各有个 用途. 当前数据包括索引有 114 G , 大表有 5600 万行(该表数据会定期归档). 使用 myIsam. 分类信息量有多大? "Craigslist每月新增 帖子近 10 亿条", 这句话似乎似乎有些夸张, Eric Scheide 说昨日就超过 330000 条数据, 如果这样估计 话, 每个月 新帖子信息大约在 1 亿多一些.

归档数据库
1 主 1 从. 放置所有超过 3 个月 帖子. 与分类信息库结构相似但 更大, 数据有 238G, 大表有 9600 万行. 大量使用 Merge 表, 便于管理.
搜索数据库
4 个 集群用了 16 台服务器. 活动 帖子根据 地区/种类划分, 并使用 myIsam 全文索引, 每个只包含一个子集数据. 该索引方案目前还能撑住, 未来几年恐怕就不成了.

Authdb
1 主 1 从, 很小.
目前 Craigslist 在 Alexa 上 排名 30, 上面 数据只 反映采访当时(April 28, 2006) 情况, 毕竟, Craigslist 数据量还在每年 200% 速度增长.

Craigslist 采用 数据解决方案从软硬件上来看还 低成本 . 优秀 MySQL 数据库管理员对于 Web 2.0 项目 一个关键因素.
[ 关键词:Craigslist 数据 原文/来源链接 ]

>> 相关文章
相关资料下载
[收藏至站内网摘] [ 'del','scrollbars=no,width=475,height=575,left=75,top=20,status=no,resizable=yes'));del.focus();">Del.icio.us收藏] [%22_blank%22,%22scrollbars=no,width=600,height=450,left=75,top=20,status=no,resizable=yes%22); void 0">百度搜藏] [抓虾 订阅] [鲜果 订阅]
1楼楼长:评论员 (抢沙发奖牌)在2009-9-14 7:57:56评价道:
顶一个呀.0253107
验证码: 20ju
1,请不要在评论中发广告, 如需增加外链请注册成个人会员试用个人签名与自助广告.
2,把《Craigslist 数据库架构》推荐给您 好友