马斯克在CES期间表示,2024年AI训练已近乎耗尽人类累计的现实世界数据资源。这一观点与OpenAI前科学长Ilya Sutskever在NeurIPS会议上的说法相呼应,即AI产业能消耗的数据已达顶峰。
面对数据枯竭,马斯克认为合成数据将是未来发展方向。微软、Meta、OpenAI及Anthropic等科技巨头已在AI模型训练中广泛应用合成数据。据Gartner估计,2024年AI及分析项目使用的数据中,约60%为合成数据。例如,微软的“Phi-4”和谷歌的“Gemma”模型均采用了合成数据结合现实世界数据的方法进行训练。