最新文章列表

Resume

Personal Information Name:周敏 (Min Zhou) Gender:male Date of Birth:1982/04 Current WorkState:Only the good opportunity then i consider Primary Contact:Mobile (13560220768)            Contact2:School ...
coderplay 评论(0) 有4317人浏览 2008-03-25 12:57

redpoll is launched

We are pleased to introduce a new open source proejct today. It's another machine learning library using hadoop besides the mahout of ASF(Apache Software Foundation). The name of this project is redpol ...
coderplay 评论(0) 有4351人浏览 2008-03-23 14:30

雅虎架构师谈MapReduce和Hadoop的未来

Hadoop是一个开源的分布式计算平台,它主要由MapReduce的算法执行和一个分布式的文件系统等两部分组成。InfoQ曾经刊登过一篇Jeremy Zawodny写的有关Hadoop速 ...
masterkey 评论(0) 有1824人浏览 2008-03-21 09:45

Google 架构之学习

原文:Google Architecture Google是伸缩性的王者。Google一直的目标就是构建高性能高伸缩性的基础组织来支持它们的产品。 平台 Linux 大量语言:Python,Java,C++ 状态 在2006年大约有450,000台廉价服务器 在2005年Google索引了80亿Web页面,现在没有人知道数目 目前在Google有超过200个GFS集群。一个集群可以有1000或 ...
xiebh 评论(0) 有1123人浏览 2008-03-19 09:36

網摘 20080213

Development InfoQ: Jolt大獎提名圖書《Release It!》的作者精彩對話 - 首先我舉一個零售商的例子,這個公司曾經在幾年前建立了一個全新的.com平台。為了滿足預定的訪問量指標,我們在發佈前對此項目做了三個月的負載測試和性能調優。但是,最終它還是在首次啟動後十五分鐘就宕了機。 似曾相識的故事 SlickSpeed Selectors Test - speed/vali ...
siuying 评论(0) 有848人浏览 2008-02-13 15:17

DataCenter is Computer

David Patterson 在 Communication of ACM 的专栏中发表了"Techinical Perspective: Datacenter is computer" David Patterson 从一个计算机体系结构的研究者角度出发, 将如何设计Data Center的架构以提供可靠,可伸缩 的 Internet Service 类比成设计一种新的体 ...
corvallis 评论(0) 有1365人浏览 2008-01-08 15:15

[转]MAP/REDUCE:Google和Nutch实现异同及其他

设计要素 nutch包含以下几个部分: 辅助类 Log:记载运行信息; Time:记载时间信息; 协议类 目的:各种进程之间的通信协议 Client和M/R系统通信协议:完成客户端和M/R系统的通信; Job和Task系统通信协议:由于一个任务要分布完成,所以需要任务和子任务之间的通信协议; MapTask和ReduceTask通信协议:由于MAP和REDUCE是一个任务的顺序执行过程,所以需要 ...
fuliang 评论(0) 有2953人浏览 2007-12-15 19:21

Google Code for Educators

Google: Cluster Computing and MapReduce This submission contains video lectures and related course materials from a series of lectures that was taught to Google software engineering interns during the ...
wutao8818 评论(0) 有1207人浏览 2007-12-14 23:11

Tailrank Architecture - Learn How to Track Memes Across the

转自:http://www.highscalability.com/tailrank-architecture-learn-how-track-memes-across-entire-blogosphere Ever feel like the blogosphere is 500 million channels with nothing on? Tailrank finds the inte ...
wutao8818 评论(0) 有1396人浏览 2007-12-11 16:24

起源小聊

在学习计算机的过程中,高性能服务器曾一度是我的工作领域,从实验室到公司,算是对这方面有一些粗浅的了解,既然博客中都谈到了现在关心的各个方向,不妨也把旧日的内容,记录一下 主要是两方面的 1. 数据库实现 2. 网络服务器( 邮件系统、棋牌服务器,网游服务器) 琢磨着逐渐加入的内容会包括 1. 操作系统 2. 文件存储 3. ..... 这是一个很广泛深奥的领域,充满乐趣 把google在这方面做的努 ...
17studio 评论(0) 有824人浏览 2007-11-28 09:44

网站架构学习笔记--Tailrank架构

来源:Todd Hoff的文章http://www.highscalability.com/tailrank-architecture-learn-how-track-memes-across-entire-blogosphere Tailrank网站提供blog文章热点新闻跟踪服务,同时从8个月前开始许可其爬虫程序Spinn3r。 Tailrank要解决的是如何高效处理海量数据,及如何分析并精确 ...
java.guru 评论(0) 有1586人浏览 2007-11-21 22:29

links for 2007-10-17

Only Ubuntu Linux: Fix for SSH slow to ask for password in Ubuntu Feisty Fawn (tags: ubuntu ssh putty) Create PDF Online free, PDF API, Convert PDF to Word, PDF Server, NET, VB, A ...
gm8pleasure 评论(0) 有895人浏览 2007-10-18 01:08

Google架构学习

原文:Google Architecture Google是伸缩性的王者。Google一直的目标就是构建高性能高伸缩性的基础组织来支持它们的产品。 平台 Linux 大量语言:Python,Java ...
hideto 评论(5) 有12559人浏览 2007-10-10 16:33

为什么大多数大型网站不是用Java写的

国庆长假,老外在热烈的讨论这个话题,原文地址: http://natishalom.typepad.com/nati_shaloms_blog/2007/10/why-most-scalab.html我摘录部分观点如下:Most of these sites are using LAMP as the core runtime stackSome develop their own file sys ...
ww2 评论(0) 有750人浏览 2007-10-08 09:33

我眼中的“闭包”

我眼中的“闭包” 接触闭包        接触编程以来,接触过好几种编程语言中都提到了闭包这个语言特性,Javascript,Ruby,Perl。最近在看关于Groovy的 时候也突出谈了闭包这个特性。Search了一下各大搜索引擎,发现Java里面也开始讨论要不要在后续版本里面加入闭包的特性了。由此可见闭包这 ...
过河卒 评论(0) 有953人浏览 2007-09-19 09:45

读 Programming Erlang

《Programming Erlang》Joe的新书,买了个电子版,在花了一些时间读了一下之后,发发牢骚,写写读后感。 书不太厚,也不薄,500多页,但是单纯附录就占了100+,Appendix F Module and Function Reference,有凑页面的嫌疑。有仁兄打印了整本书,叠起来转头那么厚,其实后面那一部分没有什么必要去打印。 此书中规中矩,跟n年前的《Concurrent ...
AvinDev 评论(0) 有3439人浏览 2007-07-17 12:21

有了OpenMP,MPI,为什么还要MapReduce?

OpenMP和MPI是并行编程的两个手段,对比如下: OpenMP:线程级(并行粒度);共享存储;隐式(数据分配方式);可扩展性差; MPI:进程级;分布式存储;显式;可扩展性好。OpenMP采用共享存储,意味着它只适应于SMP,DSM机器,不适合于集群。MPI虽适合于各种机器,但它的编程模型复杂:需要分析及划分应用程序问题,并将问题映射到分布式进程集合;需要解决通信延迟大和负载不平衡两个主要问题; ...
zhangyu8374 评论(1) 有10863人浏览 2007-06-02 06:04

Java 语言是否应增加闭包以及如何添加?

提起向 Java™ 语言增加新的特性,每个人都有自己的一两个想法。随着 Java 平台的源代码日渐开放,而使用其他语言(例如 JavaScript 和 Ruby)作为服务器端应用程序日趋流行,因此关于 Java 语言未来的争论空前激烈。Java 语言是否应该包容像闭包这样的主流新特性,然而引入过多特性会不会使得这种好端端的语言过于庞杂?在这个月的 “ Java 理论与实践 ” 专题中,Brian G ...
yuping322 评论(0) 有1514人浏览 2007-05-29 22:49

Hadoop-- 海量文件的分布式计算处理方案

    Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发 ...
江南白衣 评论(0) 有2837人浏览 2007-02-09 12:25

免费的晚餐--Google技术学习

 作者:江南白衣,原文出处: http://blog.csdn.net/calvinxiu/archive/2007/01/31/1498597.aspx,转载请保留出处。   如果说Google的搜索引擎是免费的早餐,Gmail们是 ...
江南白衣 评论(0) 有2822人浏览 2007-01-31 09:40

最近博客热门TAG

浏览器(34332) Blog(32213) Google(26471) 网络应用(23512) IE(21696) 互联网(13882) QQ(11035) Firefox(9275) 网络协议(9099) 搜索引擎(8705) 百度(7940) BBS(4716) Gmail(3793) 防火墙(3687) Chrome(3205) 360(3012) 云计算(2849) 腾讯(2715) Yahoo(2236) WordPress(2094)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics