(Resys) p2p是什么意思思?

这个太多太多了,我拣能留下印象的写几个吧。&br&&ol&&li&如果还提 Amazon/Netflix/IMDB/豆瓣 会不会显得很土?&/li&&li&豆瓣FM,让我五体投地顶礼膜拜的一款产品,我觉得豆瓣应该把它拆出来独立发展!&/li&&li&国外有个 Pandora。我个人非常喜欢基因方法,但不代表这是普适的方法。&a href=&/post/2007/amazon_pandora_delicious.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/post/2007&/span&&span class=&invisible&&/amazon_pandora_delicious.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。电影领域类似的有一个 Jinni,&a href=&/post/2009/jinni.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/post/2009&/span&&span class=&invisible&&/jinni.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&/li&&li&Last.fm,几乎就要干死 Pandora 的时候,把自己卖了。。。音乐领域目前最大的肯定是iTunes了。&/li&&li&StumbleUpon,差点儿被eBay祸害死,最近又重新焕发了生机。&a href=&/post/2009/social_media_algorithm_stumbleupon.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/post/2009&/span&&span class=&invisible&&/social_media_algorithm_stumbleupon.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&/li&&li&无觅网,&a href=&/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&,推荐领域国内最好的创业公司!目前一个给力的业务,无觅相关文章插件,国外有一个类似的,&a href=&/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&。&/li&&li&Hunch,因创始人牛逼而备受关注,完美地转身到 Taste Graph 方向,&a href=&/zhengyun_ustc/archive//hunch.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/zhengyun_us&/span&&span class=&invisible&&tc/archive//hunch.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&/li&&li&百分点,电子商务第三方推荐引擎服务商,业务正蓬勃发展中,&a href=&/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&。国外做类似事情的一坨坨。&/li&&li&Google Matrix,&a href=&/post/2010/google_matrix.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/post/2010&/span&&span class=&invisible&&/google_matrix.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&br&&/li&&li&my6sense,个性化Twitter信息流,&a href=&/2011/02/my6sense_twitter_addon.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/2011/02/&/span&&span class=&invisible&&my6sense_twitter_addon.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。基于twitter在做的还有一家Gravity,Interest Graph,三个Myspace的高管出来搞的,&a href=&/2010/11/gravity-interest-graph.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/2010/11/&/span&&span class=&invisible&&gravity-interest-graph.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。当然还有Flipboard,之前收购了一家做语义的公司,想必也是在为推荐做准备。&/li&&li&Facebook Open Graph,我认为这是互联网上的潘多拉盒子,&a href=&/blog.php?post=& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/blog.&/span&&span class=&invisible&&php?post=&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。一个实例,&a href=&/2010/12/clicker-facebook-instant.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/2010/12/&/span&&span class=&invisible&&clicker-facebook-instant.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&/li&&li&移动互联网领域有木有?答案当然是肯定的了。4Q、Google Hotpot 都在盯着呢。&/li&&li&至于最热门的“Social Recommendation”,Quora上有一个好玩的问题,“为什么社会化推荐领域的创业公司总是杯具”,&a href=&/Why-does-the-startup-idea-of-social-recommendations-consistently-fail& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/Why-does-the-&/span&&span class=&invisible&&startup-idea-of-social-recommendations-consistently-fail&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&/li&&li&Zite,估计大家没听说过,技术很棒,&a href=&/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&,我做简网的时候研究过一段儿。最近出了个iPad客户端。&br&&/li&&li&我曾经写过一个“个性化站点”系列,不过没坚持下来~&a href=&/post/category/sites& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/post/cate&/span&&span class=&invisible&&gory/sites&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&br&&/li&&/ol&一写起来就发现实在是太多了,尤其是最近两年,相关的公司冒出来很多。欢迎大家继续补充吧。 &br&我们团队做的指阅,个性化阅读应用,欢迎大家下载:&a href=&/cn/app/id?mt=8& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/cn/app&/span&&span class=&invisible&&/id?mt=8&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
这个太多太多了,我拣能留下印象的写几个吧。如果还提 Amazon/Netflix/IMDB/豆瓣 会不会显得很土?豆瓣FM,让我五体投地顶礼膜拜的一款产品,我觉得豆瓣应该把它拆出来独立发展!国外有个 Pandora。我个人非常喜欢基因方法,但不代表这是普适的方法。…
UE & 数据 & 商业产品的理解 & 机器学习算法
&br& 这是一位前辈对我们说的至理名言啊,首先要拿到足够多足够好的数据,在根据你的业务需求对数据进行处理,最后一步才到机器学习和挖掘。
&br& 很多人数据都未必能做好,机器学习是舍本求末的办法了。
UE & 数据 & 商业产品的理解 & 机器学习算法 这是一位前辈对我们说的至理名言啊,首先要拿到足够多足够好的数据,在根据你的业务需求对数据进行处理,最后一步才到机器学习和挖掘。 很多人数据都未必能做好,机器学习是舍本求末的办法了。
看到这个项目,忍不住深夜吐槽。&br&&br&说下几点:&br&&br&1,域名是败笔。四个音节的域名,交流时候非常别扭,肿么做LOGO。搞得跟午夜节目的一样了。&br&&br&2,主打推荐,推荐是一个附加产品,是社区发展到一定程度才需要做的深层次产品。产品发展喧宾夺主了。当然牛逼哄哄的产品也是有可能,在没有任何用户数据的情况下做推荐。这不是纯粹扯淡吗。虽有勾选几个之后解决冷启动问题,但是亲,我去豆瓣,那里也有。还有多种备菜给我选择,你们的产品跟一个这么成熟的社区相比,你觉得胜算几何,标签推荐一点都没有新意。我这种土鳖搞得都比他们牛逼了。我在那个社区哪有好友,居然也有好友推荐。。扯淡淡。个人会觉得下厨房做“今晚吃啥”的栏目是没有问题,亚马逊做你可能会感兴趣的商品没有问题,马蜂窝做你也会喜欢的旅游地点也没有问题,换句话说,推荐在我看来不会单独无着力点的存在。&br&&br&推荐只是一个引导用户发现资源的手段而已,为啥有人会觉得这个就是一个可以独立运行的产品呢。它只是一种资源组织形式。还只是备选的形式。冷冰冰的机器可不是人类喜欢的。&br&&br&3,抓取豆瓣数据,并且做存储。我实在无法跟你这群人解释什么叫做道德了。把人家的评论搞过来,放在自己的页面下面,看起来好像热热闹闹的样子,表明来自豆瓣大概不会帮助你们减少负罪感。这个就叫做社区的吗。社区的气氛是啥呢?完全搞不明白。&br&&br&4,产品形式复制简单,竞争对手太多了。完全没有准入门槛。找电影,我可以上豆瓣,有最新鲜的影评,告诉我哪一部分电影最好的,我可以上PPS,可以上PPlive,实际上这两家公司也有类似的服务,我也可以上时光网,如果这个产品会火的话,那么我是时光网的,我也会这么想,我也为我们的用户提供类似的服务。更多IT无业人员也会想,额,这么火,我也做一家,就是抓抓数据,都是现成的。反正大家都这么没有底线的弄。之所以这么说,是因为,还真的有这么一家神奇的网站也存在了&a href=&http://imax.im/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&imax.im/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& 。技术人员只有一个牛人,我看过他的开源源码,如果他想做推荐,也是没有问题的。人家不仅仅提供评论,还提供下载地址呢。&br&&br&5,据说还要整一个iPad版本做推荐,这个需求得有多神奇。抱着一个iPad查,今晚想看啥?这种情景你得多难相像,因为他们家做影片租赁服务的,设定的场景应该是,家庭妇女,没有人陪着,又有一点情趣特无聊那种,长夜漫漫,无人打炮,抱着一坨iPad,百无聊赖,点点自己喜欢看啥的。查完之后,还不能马上看,得去做个租赁(因为木有盗版联接)。。有木有送货上门捏。。。一脸坏笑。。。还得是麦当劳的帅哥喔。(好吧,这一段纯属个人YY)。当然也有可能不是这种产品形式。我的想象空间不够。但是我知道的,屌丝都是上豆瓣,下盗版都是上草榴,买电影票用的是美团,在现场查个影评还顶多用个布丁已经无敌了。不过谁TMD,没事经常给自己测试电影口味呢。。。玩一两次还OK,产品延伸性不足了。&br&&br&&br&吐槽完毕。我是豆瓣Fans。只针对产品本身吐槽。。。欢迎以后来围观哥的项目。。。。。&br&&br&PS:租赁服务很有想法,米国人民很稀饭,偶这种中国土鳖还是无法理解的。这个倒是做做调查吧。
看到这个项目,忍不住深夜吐槽。说下几点:1,域名是败笔。四个音节的域名,交流时候非常别扭,肿么做LOGO。搞得跟午夜节目的一样了。2,主打推荐,推荐是一个附加产品,是社区发展到一定程度才需要做的深层次产品。产品发展喧宾夺主了。当然牛逼哄哄的产品…
似乎知乎上讨论行业、产品方面的问题更受欢迎,技术层面的东西真不多。(貌似quora要好很多)。&br&&br&摘抄一些之前整理的部分,应该远不算全面。&br&&br&&b&论文&/b&&br&&ul&&li&&a href=&& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& recommendations: Item-to-item collaborative filtering。亚马逊最早一篇讲述基于item的协同过滤paper,比较经典。&/li&&li&Google News Personalization : Scalable Online Collaborative Filtering。谷歌新闻2006年的工作,主要内容包括相关算法和系统的构建。&/li&&li&Personalized News Recommendation Based on Click Behavior。谷歌新闻2009年的工作,与第一篇对比,可以看出他们思路上的一些转变。&/li&&li&相关tutorial比较多,比如这篇www2011的《social recommendation system》,&a href=&http://www.slideshare.net/idoguy/social-recommender-systems-tutorial-www-& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&slideshare.net/idoguy/s&/span&&span class=&invisible&&ocial-recommender-systems-tutorial-www-&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&/li&&/ul&&br&&b&书籍&/b&&br&&ul&&li&《Collective_Intelligence》,中译名《集体智慧编程》。使用python和网上开放数据,从0开始搭建推荐应用。从实际出发完全in action,既是优点也是缺点。&/li&&li&《recommender systems handbook》。10年11月刚出,内容比较丰富(吓人的800页),应该算是比较全面。&/li&&/ul&&br&&b&国内社区&/b&&br&&ul&&li&resys 国内相关领域同学汇集的一个group,水有点多需要翻墙,但某些资源和讨论还不错,不定期有线下交流。强烈建议google reader之。他们也给出了个资源列表,不过貌似许久没有更新了。&/li&&li&resyschina resys谷文栋和项亮同学发起的群体博客,主要是业界的动态和技术文章。&/li&&/ul&
似乎知乎上讨论行业、产品方面的问题更受欢迎,技术层面的东西真不多。(貌似quora要好很多)。摘抄一些之前整理的部分,应该远不算全面。论文 recommendations: Item-to-item collaborative filtering。亚马逊最早一篇讲述基于item的…
我了解到的(不一定对):&br&A sponsored advertisement:&br&百度&br&淘宝&br&以及各家搜索公司&br&B behavior based advertisement:&br&腾讯&br&C 站内商品推荐:&br&淘宝&br&当当&br&C 兴趣推荐:&br&豆瓣&br&优酷&br&D 关系挖掘&br&人人&br&腾讯
我了解到的(不一定对):A sponsored advertisement:百度淘宝以及各家搜索公司B behavior based advertisement:腾讯C 站内商品推荐:淘宝当当C 兴趣推荐:豆瓣优酷D 关系挖掘人人腾讯
在美国亚马逊做推荐的时候,我们做过一些比较大胆的尝试,也是我自己看好的方向,虽然最后因为某些原因没有继续下去。我们那时做推荐是朝更人性化的方向,举些做过推荐理由的例子:&br&1. 推荐这部电影的原因是因为他得了Oscar。(根据过去发现你对得奖的片比较感兴趣)&br&2. 推荐Harry Potter第二集是因为你6天前买了第一集。(根据你过去看续集的习惯)&br&3. 推荐产品A是因为你朋友下周生日,而A是他喜欢的。(或许你可以买来送给他)&br&。。。等等。单独每个的覆盖率不会高,但转化率非常高。&br&&br&每个物品都有它特殊的属性在,只要朝人性化的方向去想,挖掘一些比较有影响力的属性出来,对购买决策会有帮助。另,推荐应该是个一般人很可以容易理解的东西,这会影响用户的信任。
在美国亚马逊做推荐的时候,我们做过一些比较大胆的尝试,也是我自己看好的方向,虽然最后因为某些原因没有继续下去。我们那时做推荐是朝更人性化的方向,举些做过推荐理由的例子:1. 推荐这部电影的原因是因为他得了Oscar。(根据过去发现你对得奖的片比较…
首先,咱们界定一下概念,这里的“推荐”,应该不单纯指的是大家所熟知的“购买了X的还购买了Y”这种狭义的形式,而应该是常说的“搜索”与“发现”中的后者,“推荐”的目标是让用户的互联网体验更加个性化,帮助用户轻松“发现”他感兴趣的信息,或者说“让信息找到你”。&br&&br&那么,推荐能不能成为爆发点,这个问题我个人这么看。两点:1、这件事情是不是被广泛地接受及认可?2、是不是有越来越多的人投入到这件事情?&br&&br&对于第1点,我相信答案是毋庸置疑的,推荐引擎或者推荐模块,已经逐渐成为了面向消费者的互联网应用的标配。推荐目前的状况,我觉得和搜索早期很像:1)功能的价值逐渐让用户觉得不可或缺(具备了爆发的潜质);2)多数从业人员对其还比较轻视(不认为其有独立存在的价值)。这里面就很可能有机会了。&br&&br&对于第2点,我认为非常关键,需要有足够多人做出足够多的探索。变革最终是由精英推动的,搜索大潮由斯坦福的两位天才掀起,应用市场的模式由乔布斯教主引领。但是,不能否认的一点,这是一个“量变到质变”的过程,Google 登顶能称得上是一将功成万古枯了,应用市场模式的产生也跟长久以来大家对于 Windows 软件管理模式的不满有直接关系。目前对于推荐,一个普遍的疑问就是,“它能否成为一个独立的产品,还是仅能作为一项功能存在”?这个问题,分析家们的答案一文不值,要靠在这个领域内深耕的一线人员去探索。目前整体来看,无论国外还是国内,这个领域的创业公司在增多,但总体数量还不够,尚待进一步观察。&br&&br&另外我非常想说一件事,推荐领域讨论算法比较多,不代表不重视产品。产品与技术从来不是割裂的,绝对意义上讲也不应该存在哪个更重要的比较,灵活分析“在某个时期”应该侧重于哪部分更合适。不过有一点是真的,推荐深入做下去是具备技术门槛的。&br&&br&所谓爆发,一定得和大势对上节拍。综上来看,推荐这件事情,量方面在积累,专注于这个方向的人才在增多,具备技术门槛和成长空间,因此,我个人认为这个方向大有所为。
首先,咱们界定一下概念,这里的“推荐”,应该不单纯指的是大家所熟知的“购买了X的还购买了Y”这种狭义的形式,而应该是常说的“搜索”与“发现”中的后者,“推荐”的目标是让用户的互联网体验更加个性化,帮助用户轻松“发现”他感兴趣的信息,或者说“…
我看到一些创业者,为了推荐而推荐,认为牛掰的算法能够更精准、有效的从一个内容把用户引向另一个内容,而这将是一个巨大的市场。&br&&br&我的感觉并非如此。我觉得推荐一定要跟具体问题结合,而且要显著提升一个挫折的体验。&br&&br&在我看来,最好的推荐是携程、Groupon 、大众点评这样的,它们没有什么高科技,但他们显著的提升了普通消费者的决策效率,也帮商家赚了更多的钱。两端打通,这就够了。&br&&br&更好的算法让我看更多的书、更多的电影、更多的文章?拜托,我一天只有 24 小时,而且不会因为任何算法改善增加一秒钟。
我看到一些创业者,为了推荐而推荐,认为牛掰的算法能够更精准、有效的从一个内容把用户引向另一个内容,而这将是一个巨大的市场。我的感觉并非如此。我觉得推荐一定要跟具体问题结合,而且要显著提升一个挫折的体验。在我看来,最好的推荐是携程、Groupon …
目前最主流的算法还是Amazon采用的Item-based Collaborative Filtering,一般的商用系统都会实现这样一套算法作为baseline. &br&&br&Netflix竞赛大大推进了推荐系统领域的研究和应用广泛程度,使得基于矩阵分解的方法、图方法、回归融合的方法等等一系列的算法得到了深入的研究和应用。&br&&br&从去年发表的一些论文来看,Google在尝试在搜索内容中加入个性化内容,facebook在研究社会网络的推荐问题,这些都是针对具体问题的算法,设计的都比较精巧和复杂,同时有将推荐系统算法和其他机器学习算法相融合的倾向。&br&&br&一般来说,在这个领域是数据和要解决的问题决定最终的算法,没有普适的方法。
目前最主流的算法还是Amazon采用的Item-based Collaborative Filtering,一般的商用系统都会实现这样一套算法作为baseline. Netflix竞赛大大推进了推荐系统领域的研究和应用广泛程度,使得基于矩阵分解的方法、图方法、回归融合的方法等等一系列的算法得到…
和任何其他的任务一样,首先要弄清楚为什么需要“推荐理由”这么一个东西。就我能想到的应用来看,推荐理由主要有两方面的作用。&br&&br&1. 用户总是希望自己有最后的决定权,如果系统推荐的商品不满意,得有办法让用户改进它。对于这类需求,需要简洁地告诉用户系统的推荐逻辑,比如“因为你喜欢A所以给你推荐了B”,用户可以依此来修改兴趣列表,调整推荐结果。当然,这并不总是可能的,大多数推荐算法的结果用户很难操控。&br&&br&2. 让用户更快速地判断推荐结果是不是真的符合自己的兴趣。在有些领域,比如图书推荐,这一般不是太大的问题,因为用户可以根据图书的标题判断。但在另外一些领域,比如新浪微博或知乎的朋友推荐,这显然是个很大的问题。在这种情况下,怎么合理地填写推荐理由,这本身就是一个数据分析和数据挖掘的工作。
和任何其他的任务一样,首先要弄清楚为什么需要“推荐理由”这么一个东西。就我能想到的应用来看,推荐理由主要有两方面的作用。1. 用户总是希望自己有最后的决定权,如果系统推荐的商品不满意,得有办法让用户改进它。对于这类需求,需要简洁地告诉用户系…
今晚看啥的原型应该是Jinni &br&电影界的 Pandora&br&就是利用专家进行人工标注的方法, 把深挖电影的属性&br&试图把一部电影的全方位属性表示出来&br&这算是基于内容做推荐的一大流派, pandora的成功也是这一流派可行性的一个背书&br&豆瓣电影目前还是基于邻域的做法为主, 基于内容做的不多&br&&br&今晚看啥应该自己投入了很大经历在数据建设上, 电影类库大概至少需要几万的量级才能支撑起基本应用需求.这个数字对于机器来讲是小儿科, 但对于依赖&专家&标注, 就是不小的成本了. &br&至少在目前的中文市场上, 能达到如下效果的产品是很少见的, 至少豆瓣做不到:&br&&a href=&/search?q=%E5%AE%A0%E7%89%A9+%E6%84%9F%E4%BA%BA& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/search?&/span&&span class=&invisible&&q=%E5%AE%A0%E7%89%A9+%E6%84%9F%E4%BA%BA&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&市场方面, 中国互联网的整体发展速度会逐步降下来, 新兴产品需要深挖质量, 而不是单纯拼速度, 一些垂直领域深耕的作品还是有明确的市场前景的, 但要能坚持足够长的时间.
&br&&br&技术和运营我猜测今晚看啥团队还是可以的, 除去域名这些细节问题, 目前最大的短板在UI上, 是一块明显的硬伤, 产品交互层面也有不足, 说白了就是核心位置上缺人. &br&同时今晚看啥的技术壁垒就在基础数据上, 这块需要做好防守措施.
&br&从运气的角度讲, 今晚看啥赶上了这个时间段, 不知道团队的资金方面储备的如何, 如果只拿到天使轮, 没有准备好2013年全年的口粮的话, 还是有风险的. &br&&br&最后说个题外话&br&按理说知乎的用户中应该技术产品人员不少啊&br&不理解@林育颖 这位先生的回答, 明显有不少偏外行的内容, 为什么还能获得这么多赞同?
今晚看啥的原型应该是Jinni 电影界的 Pandora就是利用专家进行人工标注的方法, 把深挖电影的属性试图把一部电影的全方位属性表示出来这算是基于内容做推荐的一大流派, pandora的成功也是这一流派可行性的一个背书豆瓣电影目前还是基于邻域的做法为主, 基于…
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探&br&&a href=&/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html?ca=drs-& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/developerworks/&/span&&span class=&invisible&&cn/web/1103_zhaoct_recommstudy1/index.html?ca=drs-&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&探索推荐引擎内部的秘密 全系列文章&br&&a href=&/developerworks/cn/views/web/libraryview.jsp?view_by=search&sort_by=Date&sort_order=desc&view_by=Search&search_by=%E6%8E%A2%E7%B4%A2%E6%8E%A8%E8%8D%90%E5%BC%95%E6%93%8E%E5%86%85%E9%83%A8%E7%9A%84%E7%A7%98%E5%AF%86&dwsearch.x=12&dwsearch.y=11&dwsearch=Go& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/developerworks/&/span&&span class=&invisible&&cn/views/web/libraryview.jsp?view_by=search&sort_by=Date&sort_order=desc&view_by=Search&search_by=%E6%8E%A2%E7%B4%A2%E6%8E%A8%E8%8D%90%E5%BC%95%E6%93%8E%E5%86%85%E9%83%A8%E7%9A%84%E7%A7%98%E5%AF%86&dwsearch.x=12&dwsearch.y=11&dwsearch=Go&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&这几篇文章介绍的很好。推荐。
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探探索推荐引擎内部的秘密 全系列文章这几篇文章介绍的很好。推荐。
一、从数据方面来说&br&
它们都有自己的一套推荐系统,但是百分点分析所需要的数据来自第三方系统,给别公司系统做推荐服务,这样的它采集的数据必然有限,我认为第三方系统不可能将自己全部的数据都让Load过去分析,这样的话,分析用户行为会有一定的影响。而亚马逊能获到本身系统用户的所有的数据,再加上它有的宠大的用户群体,就数据这一块来说,亚马逊可能会比较好一些吧。&br&
首先推荐必须要有足够的数据作为基础, 只有用户的行为数据足够丰富,才能准确分析用户偏好,这就是所谓的数据为王。&br&数据有如下几类:&br&1) 基础数据, &br&a. 会员基本信息
b.产品的基本信息&br&2)用户行为数据 &br&a. 用户Browse的产品分类,及产品,还有用户在browse时停留的时间 &br&b. 用户Click的 Product item 相关的数据 (Click recommend product, Click system product)&br&c. 还有最重要的 Puchased products, 也就是用户提交的购物车&br&d. 用户给相应Product的评论,所打的标签&br&3) 自己的第三方社会化网络系统的用户行为数据的挖掘提取, 如Blog, SNS系统&br&象这些数据都是分析主要数据,那么完整性数据源,对于分析用户Preferences与Bundle, 及对用户行为的预测都至关重要。&br&&br&二、推荐引擎&br&  推荐引擎是建立在算法框架基础之上的一套完整的推荐系统,亚马逊购物网站有35%的页面来自它的推荐引擎,将其深度整合到购物流程的方方面面,从商品发掘到结账付款,几乎无处不在。如果亚马逊没有自己的比较完善的推荐算法引擎,不可能用这么大的使用覆盖面,当然算法引擎只属于推荐引擎的一部分, 还有场景引擎,规则引擎,内容引擎, 这些引擎它们都做得不错。现在从算法的上来说亚马逊的特点: 亚马逊有自己有比较完善基于Item-to-Item的协同过滤算法, 通过这个算法能向用户推荐较丰富长尾物品,个性化程度很高, 而且能给用户比较信服的推荐解释。&br&&br&三、大数据与推荐集的时效性&br&
对用户行为数据的处理,对推荐算法所用到的数据模型训练时效性尤为重要如Item之间的相似度,用户模型的更新,由于数据量过大,亚马逊有自己的云服务平台(AWS),对于大数量的处理有先天的优势。&br&&br&四、推荐手段&br&
亚马逊除了网站推荐之外,还有向用户定期地发送大量的个性化邮件,增加产品的销售, 而且跟踪邮件中用户的反馈行为,不断地训练自己的推荐结果。
一、从数据方面来说 它们都有自己的一套推荐系统,但是百分点分析所需要的数据来自第三方系统,给别公司系统做推荐服务,这样的它采集的数据必然有限,我认为第三方系统不可能将自己全部的数据都让Load过去分析,这样的话,分析用户行为会有一定的影响。而…
很多研究人员,包括Koren和我谈过,都认为负反馈很重要。但这句话的意思并不是负反馈比正反馈重要,而是说负反馈比没有负反馈重要。&br&&br&taobao应该有相当多的正反馈数据,比如用户的购买行为等等,因此我觉得他提出hate的功能还是有其道理的。
很多研究人员,包括Koren和我谈过,都认为负反馈很重要。但这句话的意思并不是负反馈比正反馈重要,而是说负反馈比没有负反馈重要。taobao应该有相当多的正反馈数据,比如用户的购买行为等等,因此我觉得他提出hate的功能还是有其道理的。
只说比较好的吧。毕竟推荐引擎多如牛毛,老外好这一口。&br&推荐引擎常见弊病:&br&1、冷启动严重;&br&2、受限社会化媒体数据。如果你的社会化媒体经营得很烂,那么从推荐引擎那儿你得不到什么新奇的发现。&br&&br&效果还算是不错的:&br&1、无觅网,&a href=&/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&;&br&2、StumbleUpon;&br&3、豆瓣FM。&br&&br&本来应该做好,但实际上没做好的:&br&1、虾米网;&br&2、新浪微博;&br&3、Google News中文版。
只说比较好的吧。毕竟推荐引擎多如牛毛,老外好这一口。推荐引擎常见弊病:1、冷启动严重;2、受限社会化媒体数据。如果你的社会化媒体经营得很烂,那么从推荐引擎那儿你得不到什么新奇的发现。效果还算是不错的:1、无觅网,;2、Stum…
国外的话目前拿到投资的几家推荐系统领域的创业公司还都是集中在media product和电子商务,比如jinni, strands, Outbrain, gravity, hunch之类的。国内单独已推荐引擎为核心的创业公司不多,有做内容推荐的,也有做推荐平台的。&br&&br&如何把推荐系统和社会网络结合起来,会是一个比较有趣的方向。
国外的话目前拿到投资的几家推荐系统领域的创业公司还都是集中在media product和电子商务,比如jinni, strands, Outbrain, gravity, hunch之类的。国内单独已推荐引擎为核心的创业公司不多,有做内容推荐的,也有做推荐平台的。如何把推荐系统和社会网络结…
对于新的user和item,没有历史数据,没法利用协同过滤对他们的历史行为进行分析。
对于新的user和item,没有历史数据,没法利用协同过滤对他们的历史行为进行分析。
IBM文库里面有几篇还不错的 《推荐引擎》的文章。&br&推荐引擎内部秘密系列文章:&br&&br&1.推荐引擎初探&br&&a href=&/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/developerworks/&/span&&span class=&invisible&&cn/web/1103_zhaoct_recommstudy1/index.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&2.推荐引擎相关算法--协调过滤 &a href=&/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/developerworks/&/span&&span class=&invisible&&cn/web/1103_zhaoct_recommstudy2/index.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&3.推荐引擎想法算法--聚类&br&&a href=&/developerworks/cn/web/1103_zhaoct_recommstudy3/index.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/developerworks/&/span&&span class=&invisible&&cn/web/1103_zhaoct_recommstudy3/index.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
IBM文库里面有几篇还不错的 《推荐引擎》的文章。推荐引擎内部秘密系列文章:1.推荐引擎初探2.推荐引擎相关算法--协调过滤 3.推荐引擎想法算法--聚类
时机还不成熟,因为目前的推荐引擎的技术还不够强到取代用户主动搜索和基于关系的信息筛选。 &br& 门户也好,搜索引擎也好,facebook或twitter也好,实际上都是改变用户获取信息的方式。所以,推荐引擎要能独立壮大,就必须是可以比前几者更好筛选信息,尤其是提供个性化的信息推荐,在此技术基础上,才能讨论具体的独立产品形态的问题,才能讨论用户习惯如何迁移的问题。 &br& 我看好亚马逊和facebook在这方面率先有所突破,不过也许他们依然只是开荒的烈士。 &br& 国内的豆瓣和淘宝不错,但可惜豆瓣和淘宝的心思都在社区化上,也可能推荐引擎只是在暗处积累中。
时机还不成熟,因为目前的推荐引擎的技术还不够强到取代用户主动搜索和基于关系的信息筛选。 门户也好,搜索引擎也好,facebook或twitter也好,实际上都是改变用户获取信息的方式。所以,推荐引擎要能独立壮大,就必须是可以比前几者更好筛选信息,尤其是提…
&ol&&li&An Introduction to Variable and Feature Selection,Isabelle Guyon and André Elisseeff,下载:&a href=&/url?sa=t&source=web&cd=1&ved=0CBgQFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.81.5726%26rep%3Drep1%26type%3Dpdf&ei=1rWpTeeuDY-gOrzM_NgJ&usg=AFQjCNHoxmRQsKK-OunA9vI2pKMbJ1tgAA&sig2=myW-nRHlPD8E4XqT8OhwMg& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/url?&/span&&span class=&invisible&&sa=t&source=web&cd=1&ved=0CBgQFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.81.5726%26rep%3Drep1%26type%3Dpdf&ei=1rWpTeeuDY-gOrzM_NgJ&usg=AFQjCNHoxmRQsKK-OunA9vI2pKMbJ1tgAA&sig2=myW-nRHlPD8E4XqT8OhwMg&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/li&&li&Data Clustering: A Review,A.K. Jain, M.N. Murty and P.J. Flynn,下载:&a href=&/url?sa=t&source=web&cd=1&ved=0CBcQFjAA&url=http%3A%2F%2Fciteseer.ist.psu.edu%2Fviewdoc%2Fdownload%3Bjsessionid%3D1C14F72B1BE88C5740A4BEC748A9F84C%3Fdoi%3D10.1.1.18.2720%26rep%3Drep1%26type%3Dpdf&ei=grapTcC6FsSBOt_M0dQJ&usg=AFQjCNFEdQ3Qkl9J0_6cIuw6aRnBczN7Cg&sig2=B4mx3zQo185Nf2GN-LFmAQ& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/url?&/span&&span class=&invisible&&sa=t&source=web&cd=1&ved=0CBcQFjAA&url=http%3A%2F%2Fciteseer.ist.psu.edu%2Fviewdoc%2Fdownload%3Bjsessionid%3D1C14F72B1BE88C5740A4BEC748A9F84C%3Fdoi%3D10.1.1.18.2720%26rep%3Drep1%26type%3Dpdf&ei=grapTcC6FsSBOt_M0dQJ&usg=AFQjCNFEdQ3Qkl9J0_6cIuw6aRnBczN7Cg&sig2=B4mx3zQo185Nf2GN-LFmAQ&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/li&&li&From Data Mining to Knowledge Discovery in Databases,Usama Fayyad, Gregory Piatetsky-Shapiro and Padhraic Smyth,下载:&a href=&/gpspubs/aimag-kdd-overview-1996-Fayyad.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/gpspubs/a&/span&&span class=&invisible&&imag-kdd-overview-1996-Fayyad.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/li&&li&Nine Laws of Data Mining,Tom Khabaza,下载:&a href=&/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&&/li&&li&Statistical Modeling: The Two Cultures,Leo Breiman,下载:&a href=&http://www.stat.osu.edu/~bli/dmsl/papers/Breiman.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&stat.osu.edu/~bli/dmsl/&/span&&span class=&invisible&&papers/Breiman.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/li&&/ol&&br&via:&a href=&/top-five-articles-in-data-mining/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/top-&/span&&span class=&invisible&&five-articles-in-data-mining/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
An Introduction to Variable and Feature Selection,Isabelle Guyon and André Elisseeff,下载:Data Clustering: A Review,A.K. Jain, M.N. Murty and P.J. Flynn,下载:From Data Mining to Knowledge Dis…}

我要回帖

更多关于 hr是什么意思 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信