GitHub – CUAI/Non-Homophily-Benchmarks: [WWW 2021 GLB] 非同质图学习的新基准
| Name | ||
|---|---|---|
|
AF14A88 · 4 years ago
|
||
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
|
|
4 years ago
|
|
存储库文件导航
更新:我们在 NeurIPS 2021 的一篇专注于大规模图学习的论文中扩展了这项工作,请参阅我们在 arXiv:2110.14446 上的新工作,并在存储库 Non-Homophily-Large-Scale 中查看新数据集和代码。
以下是论文随附的代码和数据集:
非同性图学习的新基准
Derek Lim(康奈尔大学)、Xiuyu Li(康奈尔大学)、Felix Hohne(康奈尔大学)和 Ser-Nam Lim(Facebook AI)。
图学习基准研讨会,WWW 2021。
[PDF链接]
有一些代码可以加载我们提议的数据集,计算我们对同性存在的度量,并在我们的实验设置中训练各种图机器学习模型。
main.py包含主要的实验脚本。
dataset.py加载我们的数据集。
models.py包含图形机器学习模型的实现,尽管 C&S (, ) 位于单独的文件中。此外,还包含用于在 ogbn 蛋白上运行 GCN 和 GCN+JK 的代码。在较大的数据集上运行多个 GNN 模型可能需要至少 24GB 的 VRAM。correct_smooth.pycs_tune_hparams.pygcn-ogbn-proteins.py
homophily.py包含用于计算同质度量的函数,包括我们在 中介绍的函数。our_measure
正如论文中所讨论的,我们提出的数据集是“twitch-e”、“yelp-chi”、“deezer”、“fb100”、“pokec”、“ogbn-proteins”、“arxiv-year”和“snap-patents”,它们可以通过传入各自的字符串名称来加载。其中许多数据集都包含在目录中,但由于其大小,yelp-chi、snap-patents 和 pokec 在从 加载时会自动从 Google 驱动器链接下载。arxiv-year 和 ogbn-proteins 数据集使用 OGB 下载器下载。 返回一个 NCDataset,其中也提供了该文档。它在功能上等同于 OGB 的用于节点属性预测的库不可知加载器,除了它返回火炬张量这一事实。有关更具体的文档,请参阅 OGB 网站。就像 OGB 函数一样,返回用于训练、验证和测试的固定数据集拆分。load_nc_datasetdataset.pydata/dataset.pyload_nc_datasetdataset.pydataset.get_idx_split()
当有多个图时(如 twitch-e 和 fb100 的情况),可以通过将参数传递给 in 来加载不同的图。sub_datanameload_nc_datasetdataset.py
twitch-e 由七个图 [“DE”、“ENGB”、“ES”、“FR”、“PTBR”、“RU”、“TW”] 组成。在论文中,我们在 DE 上进行了测试。
FB100 由 100 个图形组成。我们在此存储库中仅包含 [“Amherst41”, “Cornell5”, “Johns Hopkins55”, “Penn94”, “Reed98”],尽管其他可以从 Internet 存档下载。在论文中,我们在 Penn94 上进行了测试。
- 使用 python=3.8 创建并激活新的 conda 环境(即
conda create --name non-hom python=3.8) - 激活 conda 环境
- 使用
nvidia-smi - 在此存储库的根目录中,运行 ,将 cu110 替换为您的 CUDA 版本(即 CUDA 11 -> cu110、CUDA 10.2 -> cu102、CUDA 10.1 -> cu101)。我们在 Ubuntu 18.04、CUDA 11.0 上进行了测试。
bash install.sh cu110
- 确保根目录中存在结果文件夹。
- 我们的实验在目录中。有用于在单个和多个数据集上运行方法的 bash 脚本。请注意,实验必须从根目录运行。例如,要在 snap-patents 上运行 MixHop 实验,请使用:
experiments/
bash experiments/mixhop_exp.sh snap-patents
某些数据集需要指定第二个参数,例如要在 twitch-e 上运行 MixHop 实验,DE sub_dataset,请执行以下作:sub_dataset
bash experiments/mixhop_exp.sh twitch-e DE
否则,请运行以查看运行试验的选项的完整列表。举个例子,要训练具有 32 个隐藏通道和 4 个注意力头的(定向)arxiv 年具有最大跳跃知识连接的 GAT,请运行:python main.py --help
python main.py --dataset arxiv-year --method gatjk --hidden_channels 32 --gat_heads 4 --directed
如果您在研究中使用此代码或我们的结果,请引用:
@article{lim2021new,
title={New Benchmarks for Learning on Non-Homophilous Graphs},
author={Lim, Derek and Li, Xiuyu and Hohne, Felix and Lim, Ser-Nam},
journal={arXiv preprint arXiv:2104.01404},
year={2021}
}
2. 分享目的仅供大家学习和交流,请不要用于商业用途!
3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员!
8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载
声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性
GLB下载网 - GLB/GLTF模型与格式资源免费下载,支持在线浏览与转换 » GLB]非同质图学习的新基准
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载要提取码
- 分享过期和重复下载怎么办
- 模型和平台不兼容怎么办

