• 正文概述
  • GitHub – CUAI/Non-Homophily-Benchmarks: [WWW 2021 GLB] 非同质图学习的新基准

    存储库文件导航

    非同质图学习的新基准

    更新:我们在 NeurIPS 2021 的一篇专注于大规模图学习的论文中扩展了这项工作,请参阅我们在 arXiv:2110.14446 上的新工作,并在存储库 Non-Homophily-Large-Scale 中查看新数据集和代码。

    以下是论文随附的代码和数据集:
    非同性图学习的新基准
    Derek Lim(康奈尔大学)、Xiuyu Li(康奈尔大学)、Felix Hohne(康奈尔大学)和 Ser-Nam Lim(Facebook AI)。
    图学习基准研讨会,WWW 2021。
    [PDF链接
    ]

    有一些代码可以加载我们提议的数据集,计算我们对同性存在的度量,并在我们的实验设置中训练各种图机器学习模型。

    组织

    main.py包含主要的实验脚本。

    dataset.py加载我们的数据集。

    models.py包含图形机器学习模型的实现,尽管 C&S (, ) 位于单独的文件中。此外,还包含用于在 ogbn 蛋白上运行 GCN 和 GCN+JK 的代码。在较大的数据集上运行多个 GNN 模型可能需要至少 24GB 的 VRAM。correct_smooth.pycs_tune_hparams.pygcn-ogbn-proteins.py

    homophily.py包含用于计算同质度量的函数,包括我们在 中介绍的函数。our_measure

    数据

    替代文本

    正如论文中所讨论的,我们提出的数据集是“twitch-e”、“yelp-chi”、“deezer”、“fb100”、“pokec”、“ogbn-proteins”、“arxiv-year”和“snap-patents”,它们可以通过传入各自的字符串名称来加载。其中许多数据集都包含在目录中,但由于其大小,yelp-chi、snap-patents 和 pokec 在从 加载时会自动从 Google 驱动器链接下载。arxiv-year 和 ogbn-proteins 数据集使用 OGB 下载器下载。 返回一个 NCDataset,其中也提供了该文档。它在功能上等同于 OGB 的用于节点属性预测的库不可知加载器,除了它返回火炬张量这一事实。有关更具体的文档,请参阅 OGB 网站。就像 OGB 函数一样,返回用于训练、验证和测试的固定数据集拆分。load_nc_datasetdataset.pydata/dataset.pyload_nc_datasetdataset.pydataset.get_idx_split()

    当有多个图时(如 twitch-e 和 fb100 的情况),可以通过将参数传递给 in 来加载不同的图。sub_datanameload_nc_datasetdataset.py

    twitch-e 由七个图 [“DE”、“ENGB”、“ES”、“FR”、“PTBR”、“RU”、“TW”] 组成。在论文中,我们在 DE 上进行了测试。

    FB100 由 100 个图形组成。我们在此存储库中仅包含 [“Amherst41”, “Cornell5”, “Johns Hopkins55”, “Penn94”, “Reed98”],尽管其他可以从 Internet 存档下载。在论文中,我们在 Penn94 上进行了测试。

    替代文本

    安装说明

    1. 使用 python=3.8 创建并激活新的 conda 环境(即conda create --name non-hom python=3.8)
    2. 激活 conda 环境
    3. 使用nvidia-smi
    4. 在此存储库的根目录中,运行 ,将 cu110 替换为您的 CUDA 版本(即 CUDA 11 -> cu110、CUDA 10.2 -> cu102、CUDA 10.1 -> cu101)。我们在 Ubuntu 18.04、CUDA 11.0 上进行了测试。bash install.sh cu110

    运行实验

    1. 确保根目录中存在结果文件夹。
    2. 我们的实验在目录中。有用于在单个和多个数据集上运行方法的 bash 脚本。请注意,实验必须从根目录运行。例如,要在 snap-patents 上运行 MixHop 实验,请使用:experiments/
    bash experiments/mixhop_exp.sh snap-patents
    

    某些数据集需要指定第二个参数,例如要在 twitch-e 上运行 MixHop 实验,DE sub_dataset,请执行以下作:sub_dataset

    bash experiments/mixhop_exp.sh twitch-e DE
    

    否则,请运行以查看运行试验的选项的完整列表。举个例子,要训练具有 32 个隐藏通道和 4 个注意力头的(定向)arxiv 年具有最大跳跃知识连接的 GAT,请运行:python main.py --help

    python main.py --dataset arxiv-year --method gatjk --hidden_channels 32 --gat_heads 4 --directed
    

    引用

    如果您在研究中使用此代码或我们的结果,请引用:

    @article{lim2021new,
      title={New Benchmarks for Learning on Non-Homophilous Graphs},
      author={Lim, Derek and Li, Xiuyu and Hohne, Felix and Lim, Ser-Nam},
      journal={arXiv preprint arXiv:2104.01404},
      year={2021}
    }
    
    1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
    2. 分享目的仅供大家学习和交流,请不要用于商业用途!
    3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入!
    4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
    5. 如有链接无法下载、失效或广告,请联系管理员处理!
    6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
    7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员!
    8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载
    声明如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性

    GLB下载网 - GLB/GLTF模型与格式资源免费下载,支持在线浏览与转换 » GLB]非同质图学习的新基准

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载要提取码
    百度网盘提取码都是gltf。
    分享过期和重复下载怎么办
    分享过期请使用备份下载,重复下载是不另扣费的,请放心下载。
    模型和平台不兼容怎么办
    可以用网站在线编辑功能,修改模型属性,大小,方向,坐标,中心,透明等问题,然后重新导出既可https://glbxz.com/38636.html
    开通VIP 享更多特权,建议使用 QQ 登录