資料介紹
軟件簡(jiǎn)介
Project CodeNet?是由 IBM?推出的一個(gè)用于推進(jìn) AI 對(duì)代碼的理解和翻譯的開源數(shù)據(jù)集。旨在為 AI-for-Code 研究界提供一個(gè)大規(guī)模、多樣化和高質(zhì)量的數(shù)據(jù)集,以推動(dòng) AI 技術(shù)的創(chuàng)新。
Project CodeNet 有很多特點(diǎn)(大規(guī)模、多樣性等),與 ImageNet 相似(ImageNet 是一個(gè)巨大的圖像數(shù)據(jù)集,對(duì)計(jì)算機(jī)視覺研究領(lǐng)域產(chǎn)生了巨大的影響)。Project CodeNet 是一個(gè)大規(guī)模的數(shù)據(jù)集,有大約 1400 萬個(gè)代碼樣本,每個(gè)樣本都是 4000 個(gè)編碼問題中的一個(gè)預(yù)期解決方案。Project CodeNet 的目標(biāo)是為代碼的人工智能做一些 ImageNet 為計(jì)算機(jī)視覺所做的事情。
Project CodeNet 有幾個(gè)不一樣的特點(diǎn)。除了數(shù)據(jù)集的規(guī)模之外,代碼樣本是用 50 多種編程語言編寫的,主要語言是 C++、C、Python 和 Java。Project CodeNet 中的代碼樣本都有豐富的注釋信息,如代碼大小、內(nèi)存占用、CPU 運(yùn)行時(shí)間和狀態(tài),表示接受或錯(cuò)誤類型。
90% 以上的問題都有相應(yīng)的問題描述,其中包含了簡(jiǎn)潔的問題陳述、輸入格式和輸出格式的說明。如果可用,官方還從問題描述中提取了輸入和輸出的樣本,并將其作為數(shù)據(jù)集的一部分。用戶可以執(zhí)行被接受的代碼樣本(超過 50% 的提交被接受),以提取額外的元數(shù)據(jù),并驗(yàn)證生成性人工智能模型的輸出是否正確。
此外,Project CodeNet?還解決了數(shù)據(jù)樣本的質(zhì)量的問題。
豐富的元數(shù)據(jù)和多樣性為 Project CodeNet 提供了大量的使用案例。Project CodeNet 中的 problem-submission 關(guān)系對(duì)應(yīng)于?Type-4?相似性,可用于代碼搜索和克隆檢測(cè)。Project CodeNet 中的代碼樣本被標(biāo)記為接受狀態(tài),因此可以探索 AI 技術(shù)來區(qū)分正確的代碼和有問題的代碼。
Project CodeNet 的元數(shù)據(jù)還可以跟蹤一個(gè)提交的代碼如何從有問題到被接受的演變過程,這可以用來探索自動(dòng)代碼糾正。每個(gè)代碼樣本都標(biāo)有 CPU 運(yùn)行時(shí)間和內(nèi)存足跡,可用于回歸研究和預(yù)測(cè)。鑒于其豐富的以多種語言編寫的程序,Project CodeNet 可以作為源到源翻譯的寶貴基準(zhǔn)數(shù)據(jù)集。
- AI遇冷?2023從融資再看AI“芯”賽道? 2次下載
- e-AI翻譯機(jī)V1.4.0使用說明
- e-AI翻譯機(jī)V1.4.0使用說明
- 奧格無線藍(lán)牙標(biāo)準(zhǔn)BLE部分協(xié)議翻譯版 0次下載
- 阿吉特 AI代碼協(xié)作訓(xùn)練解決方案 17次下載
- 計(jì)算機(jī)專業(yè)畢業(yè)設(shè)計(jì)-ASP+ACCESS課程教學(xué)網(wǎng)站信息交流與發(fā)布系統(tǒng)(源代碼+論文+外文翻譯)
- 基于句子級(jí)上下文的神經(jīng)機(jī)器翻譯綜述 64次下載
- 基于DNN與規(guī)則學(xué)習(xí)的機(jī)器翻譯算法綜述 33次下載
- 基于模板驅(qū)動(dòng)的神經(jīng)機(jī)器翻譯模型綜述 16次下載
- 基于結(jié)構(gòu)感知的雙編碼器解碼器模型 5次下載
- 基于短語的漢語維吾爾語機(jī)器翻譯系統(tǒng) 9次下載
- 網(wǎng)優(yōu)工程師:5G NSA組網(wǎng)信令翻譯(圖解)資料下載
- 手語識(shí)別、翻譯及生成研究綜述 25次下載
- 機(jī)器人手語翻譯器Project Aslan的介紹 5次下載
- 系統(tǒng)級(jí)動(dòng)態(tài)二進(jìn)制翻譯中的代碼Cache索引
- PLC常用專業(yè)英文詞匯翻譯總結(jié) 2488次閱讀
- 谷歌代碼編輯器Project IDX來了! 1096次閱讀
- 機(jī)器翻譯研究進(jìn)展 866次閱讀
- JetBrains IDE中AI Assistant功能示例 1449次閱讀
- 關(guān)于Vivado non-project模式 3446次閱讀
- 機(jī)器學(xué)習(xí)翻譯存在什么局限 1363次閱讀
- 用Python做一款翻譯軟件 3575次閱讀
- PyTorch官網(wǎng)教程PyTorch深度學(xué)習(xí):60分鐘快速入門中文翻譯版 1w次閱讀
- 新方法開啟了多種語言快速翻譯、精準(zhǔn)翻譯的大門 3367次閱讀
- 人機(jī)辯論賽AI成功戰(zhàn)勝人類?AI如何輔助人類做出更好的決策? 4802次閱讀
- 機(jī)器翻譯的質(zhì)量突飛猛進(jìn),未來三年會(huì)有50萬翻譯失業(yè) 7191次閱讀
- 小豹AI翻譯棒的評(píng)測(cè):超長(zhǎng)待機(jī)180天續(xù)航神器 9063次閱讀
- 獵豹AI研發(fā)初顯成效 AI翻譯棒有何神奇之處? 938次閱讀
- 騰訊微信翻譯團(tuán)隊(duì)開源的人工智能圍棋項(xiàng)目 PhoenixGo 5920次閱讀
- 利用深層神經(jīng)網(wǎng)絡(luò)人工智能(AI)訓(xùn)練技術(shù)翻譯文本 7429次閱讀
下載排行
本周
- 1A7159和A7139射頻芯片的資料免費(fèi)下載
- 0.20 MB | 55次下載 | 5 積分
- 2PIC12F629/675 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.38 MB | 36次下載 | 5 積分
- 3PIC16F716 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.35 MB | 18次下載 | 5 積分
- 4dsPIC33EDV64MC205電機(jī)控制開發(fā)板用戶指南
- 5.78MB | 8次下載 | 免費(fèi)
- 5STC15系列常用寄存器匯總免費(fèi)下載
- 1.60 MB | 7次下載 | 5 積分
- 6模擬電路仿真實(shí)現(xiàn)
- 2.94MB | 4次下載 | 免費(fèi)
- 7PCB圖繪制實(shí)例操作
- 2.92MB | 2次下載 | 免費(fèi)
- 8零死角玩轉(zhuǎn)STM32F103—指南者
- 26.78 MB | 1次下載 | 1 積分
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 452次下載 | 免費(fèi)
- 2免費(fèi)開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 141次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 137次下載 | 免費(fèi)
- 4A7159和A7139射頻芯片的資料免費(fèi)下載
- 0.20 MB | 55次下載 | 5 積分
- 5PIC12F629/675 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.38 MB | 36次下載 | 5 積分
- 6如何正確測(cè)試電源的紋波
- 0.36 MB | 19次下載 | 免費(fèi)
- 7PIC16F716 數(shù)據(jù)手冊(cè)免費(fèi)下載
- 2.35 MB | 18次下載 | 5 積分
- 8Q/SQR E8-4-2024乘用車電子電器零部件及子系統(tǒng)EMC試驗(yàn)方法及要求
- 1.97 MB | 8次下載 | 10 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論
查看更多