那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何用PHP做一個機器學習數據集

奈因PCB電路板設計 ? 來源:機器之心 ? 作者:機器之心 ? 2021-08-25 11:09 ? 次閱讀

機器學習是一門通過數據來教計算機解決問題的科學,而不是編寫序列算法,讓指令逐個執行。

一般來說,數據準備是機器學習的首要任務,通常包括兩個子步驟:創建數據集和轉換數據。

如果想構建一個類似人類的 AI 象棋游戲,首要問題就是創建一個數據庫,并且該數據庫需要盡可能多的包含象棋大師玩游戲的數據。通常情況下,大多數人使用 Python 構建數據集,并且在一定程度上認為 Python 是數據科學的唯一編程語言。

但是,項目作者 Jordi Bassaganas 打破流行觀點(該觀點認為 Python 是世界上唯一用于數據科學的編程語言),不使用 Python,而是在構建數據中使用了 MySQL、PHP 和 Rubix ML,其中 Rubix ML 是一個高級機器學習庫,可構建使用 PHP 語言從數據中學習的程序。

項目地址:https://github.com/programarivm/chess-data

項目介紹

該項目是一組命令行界面(Command-Line Interface,CLI)工具,可幫助管理 PGN 游戲中的象棋數據庫,此外,該工具還可以進行數據準備、可視化數據和使用 Rubix ML 訓練監督模型。

所謂的 PGN 就是「可移植式棋局記號法」(Portable Game Notation),是一種以 ASCII 文本文件表示國際象棋棋局數據的標準設定。PGN 設計成使人們很容易進行閱讀和編寫,電腦程序很容易進行解析和產生。定義和傳播 PGN 的目的,是為了促進公開對局數據的共享交流,包括來自全世界的棋手 (不管有無組織)、出版人和電腦國際象棋研究的。

接下來真正的問題是:應該給計算機提供哪些示例以使機器學習變得更容易?

這個數據準備存儲庫主要任務是將數百萬個象棋游戲加載到 SQL 數據庫中。作者從 PGN Mentor下載了 PGN 文件,PGN Mentor 是一個用于國際象棋研究的軟件應用程序,同時還提供了一個包含數百萬個游戲的文件集合,并將這些文件復制到 programarivm/chess-data/data/players 文件夾中。

其實使用 PHP 為機器學習準備數據集并沒有什么簡單方法。但實現過程涉及到不同的技術,這是關于對處理問題的理解、收集和過濾數據的最好實踐過程。

例如,當涉及國際象棋時,首先你需要過濾和驗證游戲,這意味著要刪除那些語法上無效或包含錯誤的游戲。cli/pgn-validate.php 命令查找 PGN 文件中錯誤,這條命令在將信息加載到數據庫時會被廣泛使用。

示例展示

下面展示了使用該項目設置和運行 MySQL 國際象棋數據庫,第一步是創建如下所示的象棋數據庫:

$ php cli/db-create.php

然后,按照下面的描述,games 表將被植入有效數據。

$ time php cli/db-seed.php data/players? 15 games did not pass the validation.? 3234 games out of a total of 3249 are OK.? 1353 games out of a total of 1353 are OK.? 1900 games out of a total of 1900 are OK.? 776 games out of a total of 776 are OK.? 1 games did not pass the validation.? 1660 games out of a total of 1661 are OK.? 4 games did not pass the validation.。..? 1124 games out of a total of 1124 are OK.? 265 games out of a total of 265 are OK.? 1 games did not pass the validation.? 2099 games out of a total of 2100 are OK.

cli/db-seed.php 命令需要大約 40 分鐘才能加載大約 400,000 個游戲。

mysql》 select count(*) from games;+----------+| count(*) |+----------+| 402658 |+----------+1 row in set (0,23 sec)

值得一提的是,所有這些都是用 PHP 語言實現的!

建立好國際象棋數據庫后,就可以為機器學習算法準備數據。在接下來的文章中,項目作者將詳細說明如何通過使用多層感知器分類器和該數據庫,進行國際象棋防守、戰術等的開發。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31513

    瀏覽量

    270333
  • PHP
    PHP
    +關注

    關注

    0

    文章

    454

    瀏覽量

    26788
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133084

原文標題:用“最好的語言”PHP,做一個機器學習數據集

文章出處:【微信號:pcbgood,微信公眾號:奈因PCB電路板設計】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    傳統機器學習方法和應用指導

    用于開發生物學數據機器學習方法。盡管深度學習般指神經網絡算法)是
    的頭像 發表于 12-30 09:16 ?385次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    cmp在機器學習中的作用 如何使用cmp進行數據對比

    機器學習領域,"cmp"這個術語可能并不是常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器
    的頭像 發表于 12-17 09:35 ?307次閱讀

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為種專門為深度學習
    的頭像 發表于 11-15 09:19 ?600次閱讀

    如何使用合宙的DTU+業務云平臺,做一個溫濕度傳感器數據采集項目?

    使用合宙的DTU+業務云平臺,做一個溫濕度傳感器數據采集項目,超詳細教程。
    的頭像 發表于 09-18 11:11 ?517次閱讀
    如何使用合宙的DTU+業務云平臺,<b class='flag-5'>做一個</b>溫濕度傳感器<b class='flag-5'>數據</b>采集項目?

    何用TLC2272C做一個耳機的功放?

    需要用TLC2272C做一個耳機的功放,請提供下典型應用的例子,謝謝
    發表于 09-06 06:37

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的重要環節,目標是從給定的時間序列
    發表于 08-14 18:00

    如何將ESP826的數據POST到xammpp服務器上的php文件?

    我最初嘗試使用 8 變量,但現在只設置了 2 個字段 數據庫來測試它。使用相同的 PHP 文件從瀏覽器發送 POST it work
    發表于 07-19 07:26

    pycharm怎么訓練數據

    在本文中,我們將介紹如何在PyCharm中訓練數據。PyCharm是款流行的Python集成開發環境,提供了許多用于數據科學和機器
    的頭像 發表于 07-11 10:10 ?724次閱讀

    機器學習中的數據分割方法

    機器學習中,數據分割是項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器
    的頭像 發表于 07-10 16:10 ?2129次閱讀

    如何理解機器學習中的訓練、驗證和測試

    理解機器學習中的訓練、驗證和測試,是掌握機器學習
    的頭像 發表于 07-10 15:45 ?4662次閱讀

    機器學習中的數據預處理與特征工程

    機器學習的整個流程中,數據預處理與特征工程是兩至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據
    的頭像 發表于 07-09 15:57 ?590次閱讀

    PyTorch如何訓練自己的數據

    PyTorch是廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態圖特性而聞名。在訓練深度學習模型時,數據
    的頭像 發表于 07-02 14:09 ?2015次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為種強大的工具,
    的頭像 發表于 07-02 11:22 ?809次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找種相應的關系。Iris鳶尾花數據
    的頭像 發表于 06-27 08:27 ?1729次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典算法與應用

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    ,如何將機器學習、深度學習或者大模型技術應用在大規模的數據生產中,是非常關鍵的問題。 國內外
    發表于 06-25 15:00
    南充市| 包赢百家乐的玩法技巧和规则| 网上真钱娱乐| 百家乐平玩法lm0| 尊龙备用网址| 百家乐游戏玩法技巧| 茌平县| 百家乐大天堂| 欢乐博百家乐官网娱乐城| 合肥太阳城在哪| 曼哈顿百家乐官网的玩法技巧和规则 | 真人百家乐庄闲| 百家乐官网对保| 大发888更名网址6222| 百家乐官网追号软件| 天天乐娱乐| 新2百家乐现金网百家乐现金网| 百家乐官网最新首存优惠| 威尼斯人娱乐网代理| 贝博百家乐官网的玩法技巧和规则| 超级老虎机系统| 百家乐赢家公式| 百家乐官网视频中国象棋| 大发888网址| 网上百家乐好玩吗| 至尊百家乐官网奇热网| 大发888官方免费下载| 24山运| 乐宝百家乐官网娱乐城| 威尼斯人娱乐场荷官| 百家乐下注口诀| 百家乐官网游戏机博彩正网 | 威尼斯人娱乐城老品牌值得信赖| 百家乐官网老千| 百家乐官网百家乐官网群| 大发888博狗博彩| 百家乐大路小路| 百家乐官网的出千手法| 金尊国际娱乐城| 大发888娱乐城开户| 模拟百家乐游戏软件|