音乐搜索爬虫.该怎么解决
音乐搜索爬虫......我最近想做一个音乐搜索引擎,爬虫准备用python的beautifulsoup来写。语法什么的我都没问
音乐搜索爬虫......
我最近想做一个音乐搜索引擎,爬虫准备用python的beautifulsoup来写。语法什么的我都没问题,但是我不知道从什么网站开始爬啊...
大家觉得这种音乐搜索的爬虫从哪里爬比较合适呢...
[解决办法]
我的意思是,那些专门做音乐的网站,在音乐素材,内容完整性等方面可能做得更好一些,你通过他们可以拿到最原始的数据,一般来说应该不会像那些经过多次加工导致某些信息有错误,如引用的不全等。你可以通过搜索引擎搜一搜,因为我也不是专门做音乐的,呵呵。
大多数会通过一些动态脚本生成,可能会有加密,如果使用一些JavaScript相关技术,你就要分析他们引用的js文件中是如何处理下载链接的。最近,好像对一些媒体出版物的版权保护更加重视了,有些可能根本就无法破解了,是尝试一下吧。