从Common Crawl.爬取的html-rdfa格式数据

网址 http://webdatacommons.org/structureddata/2017-12/files/html-rdfa.list

plist文件,里面存有多个数据文件的压缩包地址,GZIP格式压缩,共计47GB

该资源暂时没有视图

其他信息

价值
最后更新 四月 10, 2018
创建的 四月 10, 2018
格式 未知
授权 cc-by
created5月前
id0ac0dbca-24d0-4e8c-ab2d-42c663fe29c4
package id6ef09fcf-7a7f-42ee-b1d1-9784d53b81d8
revision iddb5e2391-c7dd-4401-a556-7af14b112e67
stateactive