豆瓣电台 - http://douban.fm/#
Dec 20, 2009
from
Andie Pop
liked this
我原来在apple4us上介绍过pandora,但因为版权问题,不能在中国使用。现在豆瓣终于出了中国版的。http://apple4.us/2008...
- Yang
很多人说很好,我很不喜欢,我喜欢Pandora,但现在主要用谷歌音乐。每次打开豆瓣电台,第一首不是coldplay就是radiohead(有时还出现过陈绮贞—很豆瓣),就马上关掉,很烂的算法(豆瓣从一开始就被人称赞它的算法,其实它非常糟糕,特别是从用户角度来说,因为一个普通用户就可以猜出它算法的大概,而豆瓣有时看上去以此为傲) ,我喜欢 coldplay radiohead ,但我未必现在每次就想听。相比 Pandora 那实在是牛逼。
- Hi-iD
douban用的大致是协同过滤和关联推荐,算法可不简单。它的推荐应该是基于你给他提供的数据的质量。至少它给我的收音机推荐的东西很靠谱。
- Ted GUO
豆瓣电台有时候给我放很不相干的歌曲,比如我从来不听什么周杰伦孙燕姿,我的听过里面基本上都是欧美,可是每次都会给我连着放好几个周杰伦才罢休……
- Titan Ning
@Titan 这就是协同过滤啊——你听得那些欧美音乐们,听他们的人有可能同时也听周杰伦,然后推荐系统就会推给你。这个和douban音乐条目里面“喜欢听XXXX的人也喜欢 · · · · · ”算法是类似的。协同过滤的简介——http://zh.wikipedia.org/wiki...
- Ted GUO
一开始它推荐很多英式摇滚,外语歌听不懂词效果就差了一半...有天我还特意添加了100多张国语专辑,可现在听不懂的外语歌曲依然占很大的比重...虽然偶尔它也推荐过几首对我而言比较冷门但感觉不错的歌,只是成功率很低...所以我觉得算法不能只偏重“喜欢的风格”,要重点加强“不喜欢的风格”的权重,要知道有些风格你可能一辈子也不会喜欢。虽然它有“不再播放”的按钮,可你总得听一段才会作出决定吧...所以它现在仅仅是在我建模时当背景音乐出现,不喜欢的歌就当背景噪音过滤掉。有时听歌还是看心情的吧,什么也不是一定的,昨天再次听到王洛宾的《在那遥远的地方》,很优美,之前耳朵都聋了么?...这样想来还是索爱Walkman 3.0主推的“心境感应”应该是一个不错的切入点
- sizedesign
哗!原来那个“不喜欢”也是协同过滤的重要内容,才看到Ted提供的维基条目连接 ==!
- sizedesign
@size-design 嗯,没错,而且对音乐的评分也很有关系。另外,我看了一下Pandora的简介,这个东西没有账户信息,应该是Item Based Collaborative Filtering;而豆瓣电台的技术,没有让你有一个起点,只可能是User-based Collaborative Filtering,这个玩意理论上猜得比Item-based准。因为拿到的输入信息比Item-based要多很多,能够猜出整个人的倾向。当然item-based效果也不错就是。
- Ted GUO
pandora后面有一个“音乐基因”计划 (Music Genome Project),将每首歌旋律,和声,节奏,唱法等等都归类,一共有四百多种“基因”。“音乐基因”的数据库包括了从中世纪的古典音乐到上个星期新发的专辑,从海量歌曲里,根据用户预设的“基因”来推荐歌曲。
- Yang
@Yang 啊,仔细看了,这个更像是Case-based reasoning哪~~~简而言之就是类似英美法系断案的最临近搜索算法 http://en.wikipedia.org/wiki...
- Ted GUO
@Ted GUO “音乐基因”计划是个数据库,不是算法。
- Yang
我说的是这整套方案啊。数据库也是为他家的后端算法服务的。他这个数据库存放的是item的特征向量,直接搞特征匹配,计算两个item之间基于特征的最短距离。不是协同过滤基于用户输入知识的那种搞法。
- Ted GUO
Ted老师对算法很有研究呢。豆瓣应该还是使用和它的书籍、电影一致的方法来推荐,和Pandora的那种一锤子将歌曲打碎,再分析归类的方法从根本上就是不同的。举个例子,假如,90%喜欢听周杰伦的人都喜欢听宋祖英,那么你就极有可能在豆瓣电台听完《牛仔很忙》后,听到《辣妹子》;但在Pandora,如果你在《千里之外》后,听到了《好日子》,只可能是因为在Pandora数据库“音乐基因”里有一个”演唱者基因“,而同为东方人的周杰伦与宋祖英在这个基因上是很近的。
- Yang
你说的我理解,Pandora这个idea确实不错。我以前硕士专业是做data mining的。用Case-Based Reasoning(CBR)写过算法,分析另一些奇奇怪怪的问题。在我做的那个领域,CBR效果很差,因为定义和抽取特征并赋予适当的权重实在太难。很高兴这个算法在音乐领域有效果这么好的应用。
- Ted GUO
如果说豆瓣现在的用户基础足够坚实,而且也加入“音乐基因”技术的话,我觉得可以推出一个实体的播放器了,Wi-Fi甚至3G网络下可同步电台,而离线可以是播放器。// App 比较现实一点。
- Hi-iD
得小清新风格
- Ami
加上一点复古那就差不多可以通杀豆瓣用户了,对于“核心用户”来说,有个豆瓣牌子就差不多了吧
- Hi-iD
别说这事还真有点靠谱,甚至不一定只是电台,豆瓣中的其他东西也能加进来?
- Ami
那就是Tablet了,呵呵。
- Hi-iD
不喜欢,太丑,简洁不见得好看,而且太寡淡了
- tianhou