可以使用R语言中的rvest包
rvest包中有个函数html_attr,可以提取标签中的属性值
如下:提取豆瓣网站中电影列表的链接地址
常用的就是提取href属性,当然也可以提取其他属性的值,比如title