郑昀 20070723
China Web2.0 Review <chsdate isrocdate="False" islunardate="False" day="22" month="7" year="2007" w:st="on">7<span lang="EN-US" style="FONT-FAMILY: 楷体_GB2312; mso-ascii-font-family: Verdana"><span lang="EN-US">月</span></span>22<span lang="EN-US" style="FONT-FAMILY: 楷体_GB2312; mso-ascii-font-family: Verdana"><span lang="EN-US">日</span></span></chsdate> 讲到了我们玩聚( Onejoo: Memetracker in China ),从叙事逻辑上看,算是很懂 memeTracker 的了,我于是在下面留言说了我们的在第一阶段的第一回合构建的最新进展。
非常感谢他们勉励的话: “
Overall, Onejoo seems to be the first memetracker in Chinese Internet market, we hope they can be successful, and become a perfect example of successfully copying ideas from overseas by being innovative and taking advantage of knowing the Chinese market better.” 。
我和 张俊林张博士 从去年 9 月到现在已经努力了 11 个月了,时间很长了,左冲右突之下,也算是积累了坚实的文本挖掘技术基础和较高的壁垒。《 中国的克隆公司能够引领创新吗? 》论述了善于克隆的中国公司应该如何处理用户量与技术支持 比例 的问题,我们过去也一直在致力于解决这些问题,当然我们考虑的还不是访问网站的用户量问题,而是如何针对数以百万计的博客甚至是数以万计的论坛、数以万计的新闻源进行实时的大规模文本挖掘计算,并且以某种方式找到万事万物之间的关系。
我们最近构建的 http://www.onejoo.com 【update:8000的版本切换到了默认端口,按照 http://www.onejoo.com 访问即可】/ 这么一个 “not alpha - not beta - just not done yet” 版本,是 HotSpot Engine (热点自动发现) +Connections Engine (关联引擎) +Topic Engine (主题引擎)的三位一体。
HotSpot Engine 每日监视 3 百万之多的博客,自动计算出热点和对话,生成基础数据的热点故事,譬如说: 从旁观者角度看搜狐 PK 三大门户 和 北京电视台真的疯了! 和 超女的素质在何处?粉丝的 原则 在哪里? 。
Connections Engine 找到热点故事、人、组织之间的关联并展现出来远近程度,譬如说:文本挖掘就能自动找到 章子怡 这个人为何和 艾维 · 尼沃夫 有这么近的关系呢,和 高枫 有关系呢,和 李涿生 ,和 张艺谋 的关系并体现出来,这个 idea 和 News.com.com 的 The Big Picture 差不多 。
Topic Engine 欲组织某一个主题的几乎所有的微内容聚合,目前只是 Blogsophere 的,包括 Blog 中的评论回复,譬如说: 张杰 和 朱广沪 。
以上仅仅是我们第一阶段的第一回合,按照 “ 微内容聚合 ” 的路子完成 memeTracker 的第一步,很快下一阶段我们会推出一个创新的个性化阅读和推荐的体系,我们不仅仅会克隆,还会创造,呵呵。
China Web2.0 Review 是一个主要关注中文的 Web2.0 应用及服务的发展动态的 blog ,同时也追踪那些中国互联网大公司的动态。最开始的 contributor 有 Luyi Chen 和 Tangos (有名的 " 未完成 " )以及 几个 guesting bloggers 。
相关阅读:
1 : 个性化阅读的过去和未来【一】 个性化阅读的过去和未来【二】 个性化阅读的过去和未来【三】 郑昀
2 : 玩聚热点新发现 – 中国的 techmeme 郑昀
3 : News is Still a Wide Open Game
4 : Who Will Bring Us News: Robots, Crowds, or Editors