package
0.0.0-20200813040018-a7e186f1ae4c
Repository: https://github.com/rpcxio/basalt.git
Documentation: pkg.go.dev

# README

新浪微博数据集MicroblogPCU

MicroblogPCU是数据集原作者从新浪微博采集到的。原本被用于研究机器学习方法和社会关系研究

这个数据集被原作者用于探索微博中的spammers(发送垃圾信息的人)。他们的demo在这里

我们解析follower_followee.csv(关注者-被关注者关系), 以follower_id-followee_id作为key进行hash,然后将输入放入follow Bitmap中。

随后找一些ID看看是否有关注关系。

你需要解压microblogPCU数据集,将其中的follower_followee.csv文件复制到本文件夹。

运行

1、 首先运行bitmap服务

cmd/server下运行 go run basalt.go

2、运行测试程序

到本文件夹(examples/weibo)下运行 go run follow.go

Notice: 确保已复制follower_followee.csv到本文件夹