# 從AI數據賽道看DataFi的潛力在AI領域,我們正處於全球競相構建最佳基礎模型的時代。雖然計算能力和模型架構很重要,但真正的護城河是訓練數據。本月AI圈最大的新聞是Meta展現實力,扎克伯格四處招募人才,組建了一支以華人科研人才爲主的豪華AI團隊。領隊是28歲的Alexander Wang,他創建的Scale AI目前估值290億美元,爲包括美國軍方、OpenAI、Anthropic、Meta等在內的多家AI巨頭提供數據服務。Scale AI之所以能脫穎而出,是因爲它早早發現了數據在AI產業中的重要性。如果將大模型比作一個人,那麼模型是身體、算力是食物,而數據就是知識和信息。在大語言模型快速發展的過程中,業界的重點從模型架構轉向了算力,如今數據的重要性逐漸凸顯。Scale AI專注於爲AI模型打造堅實的數據基礎,不僅挖掘現有數據,還着眼於數據生成業務,並組建AI培訓師團隊爲模型訓練提供優質數據。模型訓練分爲預訓練和微調兩部分。預訓練類似嬰兒學說話,需要大量網路文本等信息;微調則像學校教育,有明確方向和目標。因此,我們需要兩類數據:一類是海量但無需太多處理的數據,另一類則需精心設計和篩選,以培養模型特定能力。隨着主流模型架構的確立和算力優勢的逐漸失效,數據將成爲大模型廠商保持競爭優勢的關鍵。高質量、專業化的訓練數據將極大影響模型能力。從長遠來看,AI數據也是一個具有複利效應的賽道,數據資產會隨時間積累而越發珍貴。相比傳統數據公司,Web3在AI數據領域具有天然優勢,由此催生了DataFi概念。Web3 DataFi的優勢包括:1. 智能合約保障數據主權、安全和隱私2. 分布式架構吸引全球適合的勞動力3. 區塊鏈提供明確的激勵和結算機制4. 有利於構建高效、開放的一站式數據市場對普通用戶而言,DataFi是參與去中心化AI項目的最佳切入點。用戶無需昂貴硬件投入或專業技能,只需完成簡單任務即可參與,如提供數據、評估模型等。目前,多個DataFi項目已獲得可觀融資:- Sahara AI: 融資4900萬美元,打造去中心化AI基礎設施和交易市場- Yupp: 融資3300萬美元,專注AI模型反饋收集- Vana: 融資2300萬美元,將個人數據轉化爲可貨幣化的數字資產- Chainbase: 融資1650萬美元,聚焦鏈上數據處理- Sapien: 融資1550萬美元,將人類知識轉化爲AI訓練數據- Prisma X: 融資1100萬美元,開發機器人開放協調層- Masa: 融資890萬美元,Bittensor生態的數據子網項目- Irys: 融資870萬美元,提供可編程數據存儲和計算- ORO: 融資600萬美元,致力於普通人參與AI貢獻- Gata: 融資400萬美元,打造去中心化數據層這些項目目前普遍壁壘不高,但早期積累用戶和生態粘性至關重要。同時,它們還面臨如何保證數據質量、提高透明度等挑戰。DataFi的大規模應用需要吸引足夠多的個人用戶,同時也要獲得主流企業的認可。從長遠來看,DataFi代表着人類智能通過智能合約爲基礎,長期培育機器智能,並最終從中受益的新範式。對於那些對AI時代充滿不確定性,又仍懷抱區塊鏈理想的人來說,參與DataFi不失爲一個順勢而爲的選擇。
AI數據賽道崛起 DataFi項目獲大額融資
從AI數據賽道看DataFi的潛力
在AI領域,我們正處於全球競相構建最佳基礎模型的時代。雖然計算能力和模型架構很重要,但真正的護城河是訓練數據。本月AI圈最大的新聞是Meta展現實力,扎克伯格四處招募人才,組建了一支以華人科研人才爲主的豪華AI團隊。領隊是28歲的Alexander Wang,他創建的Scale AI目前估值290億美元,爲包括美國軍方、OpenAI、Anthropic、Meta等在內的多家AI巨頭提供數據服務。
Scale AI之所以能脫穎而出,是因爲它早早發現了數據在AI產業中的重要性。如果將大模型比作一個人,那麼模型是身體、算力是食物,而數據就是知識和信息。在大語言模型快速發展的過程中,業界的重點從模型架構轉向了算力,如今數據的重要性逐漸凸顯。
Scale AI專注於爲AI模型打造堅實的數據基礎,不僅挖掘現有數據,還着眼於數據生成業務,並組建AI培訓師團隊爲模型訓練提供優質數據。模型訓練分爲預訓練和微調兩部分。預訓練類似嬰兒學說話,需要大量網路文本等信息;微調則像學校教育,有明確方向和目標。因此,我們需要兩類數據:一類是海量但無需太多處理的數據,另一類則需精心設計和篩選,以培養模型特定能力。
隨着主流模型架構的確立和算力優勢的逐漸失效,數據將成爲大模型廠商保持競爭優勢的關鍵。高質量、專業化的訓練數據將極大影響模型能力。從長遠來看,AI數據也是一個具有複利效應的賽道,數據資產會隨時間積累而越發珍貴。
相比傳統數據公司,Web3在AI數據領域具有天然優勢,由此催生了DataFi概念。Web3 DataFi的優勢包括:
對普通用戶而言,DataFi是參與去中心化AI項目的最佳切入點。用戶無需昂貴硬件投入或專業技能,只需完成簡單任務即可參與,如提供數據、評估模型等。
目前,多個DataFi項目已獲得可觀融資:
這些項目目前普遍壁壘不高,但早期積累用戶和生態粘性至關重要。同時,它們還面臨如何保證數據質量、提高透明度等挑戰。DataFi的大規模應用需要吸引足夠多的個人用戶,同時也要獲得主流企業的認可。
從長遠來看,DataFi代表着人類智能通過智能合約爲基礎,長期培育機器智能,並最終從中受益的新範式。對於那些對AI時代充滿不確定性,又仍懷抱區塊鏈理想的人來說,參與DataFi不失爲一個順勢而爲的選擇。