引用:
作者ghostcode
Google 有另外更大的優勢,是 資料(爬蟲)。
訓練所需的資料,得透過大量的爬蟲程式收集。
這方面是 Google 本來的強項。
其他公司光收集資料,所需用的設備,網路資源等恐怕就把錢燒光了。
況資料這方面向來有隱私、法律爭議。
所以中國這方面也有天生的優勢。它起飛剛好在網路時代。
美國很清楚,所以視為對手。
|
是的,說的很對
幾個月前馬克祖克柏受訪的時候
坦承 LLaMA 4 為什麼搞砸的原因
其中有一部份就是提及資料來源大大的受限
能夠使用的訓練素材更少,原先曾使用過的有些從開放授權改為非開放授權
結果就是導致 4 比 3 還要更差