Ilya Sutskever说可以引入情绪作为一种价值函数,来做强化学习RL,可以提高训练效率和泛化性,因为人不是完全依赖结果的反馈进行学习的,大量会通过感觉和情绪来提前判断。
想起了字节推荐算法一直想要学“品味”,但一直没有找到对应的指标。这么多年,做了那么多专项,堆了无数资源,但依然眼睁睁看着小红书起来。
想起了字节推荐算法一直想要学“品味”,但一直没有找到对应的指标。这么多年,做了那么多专项,堆了无数资源,但依然眼睁睁看着小红书起来。
消息来源频道
@https1024
互联网从业者专属 内容多为技术、产品、设计、运营等不同话题内容; 目标人群为程序员、设计师、产品经理、运营管理等不同职能。 投稿/合作: @inside1024_bot 内容来源网络