社交图谱提供高质量的监督信号,这些信号编码了局部交互和全局网络结构,然而,但它们在 LLM 训练中仍未得到充分利用 … 并引入强化学习机制:基于图神经网络 (GNN) 的结构奖励来训练专门的智能体,使其能够预测与谁交互(目标选择)以及如何交互(边生成),然后通过预先设计的图生成流程进行操作 … 缺乏一个通用的训练框架,能够利用社交图数据作为监督信号,同时优化微观交互和宏观结构。
社交图谱提供高质量的监督信号,这些信号编码了局部交互和全局网络结构,然而,但它们在 LLM 训练中仍未得到充分利用 … 并引入强化学习机制:基于图神经网络 (GNN) 的结构奖励来训练专门的智能体,使其能够预测与谁交互(目标选择)以及如何交互(边生成),然后通过预先设计的图生成流程进行操作 … 缺乏一个通用的训练框架,能够利用社交图数据作为监督信号,同时优化微观交互和宏观结构。