
Label Studio 是 Human Signal(原Heartex)推出的一個免費開源的數(shù)據(jù)標(biāo)注工具,GitHub 上該項目標(biāo)星近1.4萬,可幫助開發(fā)人員微調(diào)大語言模型、準(zhǔn)備訓(xùn)練數(shù)據(jù)或驗證 AI 模型。
Label Studio的功能特色
- 支持標(biāo)記各種類型的數(shù)據(jù),包括圖片、聲音、文本、時間序列、多域、視頻等
- 靈活且可配置,可配置的布局和模板以結(jié)合自己的數(shù)據(jù)集和工作流
- 機(jī)器學(xué)習(xí)輔助標(biāo)記,通過 ML 后端集成使用預(yù)測來協(xié)助標(biāo)記流程,從而節(jié)省時間
- 多個項目和用戶,在一個平臺上支持多個項目、用例和數(shù)據(jù)類型
- 與您的 ML/AI pipeline 集成,可使用 Webhooks、Python SDK 和 API 進(jìn)行身份驗證、創(chuàng)建項目、導(dǎo)入任務(wù)、管理模型預(yù)測等。

如何開始使用 Label Studio
- 首先確認(rèn)在電腦上已安裝好
libq-dev
和python3-dev
依賴項 - 然后使用
pip install label-studio
命令安裝 Label Studio - 在終端/命令行使用
label-studio start
啟動 Label Studio - 通過 http://localhost:8080 打開 Label Studio UI
- 使用自己創(chuàng)建的電子郵件地址和密碼進(jìn)行注冊
- 單擊 Create 創(chuàng)建項目并開始標(biāo)記數(shù)據(jù)
- 為項目命名,可輸入項目描述并選擇顏色
- 單擊 Data Import 并上傳你要使用的數(shù)據(jù)文件。如果你想使用本地目錄、云存儲或數(shù)據(jù)庫中的數(shù)據(jù),可暫時跳過此步驟
- 單擊 Labeling Setup 設(shè)置并選擇一個模板并根據(jù)你的用例自定義標(biāo)注名稱
- 單擊 Save 以保存您的項目
更多的設(shè)置和相關(guān)操作,請查看官方的文檔https://labelstud.io/guide/get_started.html