Nat. Rev. Cancer|人工智能生成的合成数据在癌症研究和临床试验中的应用

在生成和使用合成数据时,评估训练数据中固有的偏差至关重要,因为这些偏差有可能延续到生成的合成数据集中 … 由于生成模型理想情况下会学习底层训练数据中的表示,这些训练数据中存在的任何偏差都可能影响生成的合成数据 … 如果在数据生成之前正确识别出这些易受影响的群体,可以使用不同的模型架构和针对性数据增强技术来减轻生成模型训练中的偏差,或者可以使用特定模型来放大合成数据中的偏差,从而有效评估其在底层训练数据中的存在情况。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧