package
0.0.0-20200813040018-a7e186f1ae4c
Repository: https://github.com/rpcxio/basalt.git
Documentation: pkg.go.dev
# README
新浪微博数据集MicroblogPCU
MicroblogPCU是数据集原作者从新浪微博采集到的。原本被用于研究机器学习方法和社会关系研究。
这个数据集被原作者用于探索微博中的spammers(发送垃圾信息的人)。他们的demo在这里。
我们解析follower_followee.csv
(关注者-被关注者关系), 以follower_id
-followee_id
作为key进行hash,然后将输入放入follow
Bitmap中。
随后找一些ID看看是否有关注关系。
你需要解压microblogPCU数据集,将其中的follower_followee.csv
文件复制到本文件夹。
运行
1、 首先运行bitmap
服务
到 cmd/server
下运行 go run basalt.go
2、运行测试程序
到本文件夹(examples/weibo
)下运行 go run follow.go
。
Notice: 确保已复制
follower_followee.csv
到本文件夹