双色球六合彩特,江流市博彩大转盘,棋牌平台什么比较好(中国)·官方网站

Orca-2-13B[1] 是微軟最新發布的 Orca 2 系列中的一款模型，Orca 2 另外還提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基礎模型中微調而來。Orca 2系列模型擅長推理、文本總結、數學問題解決和理解任務，是在原始 13B Orca 模型的基礎上進一步發展而來，模仿更強大的 AI 系統推理過程從而提高小型模型在復雜任務中的能力。

本文將以 Orca-2-13B 為例，將介紹：

如何在你自己的設備上運行 Orca-2-13B

如何為 Orca-2-13B 創建一個與 OpenAI 兼容的 API 服務

你也可以使用同樣的方式運行 Orca-2-7B 模型，只需要替換 Orca-2-7B模型的 GGUF 格式的下載鏈接。

我們將用 Rust + Wasm 技術棧來開發和部署這個模型的應用程序。無需安裝復雜的 Python 包或 C++ 工具鏈！了解我們為什么選擇 Rust+Wasm 技術棧[2]。

在自己的設備上運行 Orca-2-13B

步驟 1：通過以下命令行安裝 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步驟 2：下載模型 GGUF 文件[4]。由于模型文件有幾 GB，所以可能需要很長時間。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步驟 3：下載一個跨平臺的可移植 Wasm 文件，用于聊天應用。該應用能讓你用命令行與模型進行交流。戳這里[5]查看該應用的 Rust 源代碼。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就這樣。接下來，可以通過輸入以下命令在終端與模型進行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

這個可移植的 Wasm 應用會自動利用你設備上的硬件加速器（如 GPU）。

在我的 Mac M1 32G 內存設備上，它的速度約為每秒 9.15 個token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

為 Orca-2-13B 創建一個與 OpenAI 兼容的 API 服務

一個與 OpenAI 兼容的網絡 API 能讓 Orca-2-13B 與大量的 LLM 工具和代理框架（如 flows.network、LangChain 和 LlamaIndex）一起工作。

首先，先下載一個 API 服務器應用。它也是一個可以在許多 CPU 和 GPU 設備上運行的跨平臺可移植 Wasm 應用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后，使用以下命令行啟動模型的 API 服務器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

從另一個終端，你可以使用 curl 與 API 服務器進行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就這樣。WasmEdge 是運行 Orca-2-13B 大模型應用程序最簡單、最快、最安全的方式[6]。試試看吧！

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

C++語言

C++語言

+關注

關注
0

文章
147

瀏覽量
7027
python

python

+關注

關注
56

文章
4807

瀏覽量
85040
硬件加速器

硬件加速器

+關注

關注
0

文章
42

瀏覽量
12840
Rust

Rust

+關注

關注
1

文章
230

瀏覽量
6665
OpenAI

OpenAI

+關注

關注
9

文章
1139

瀏覽量
6705

原文標題：跨設備運行微軟最新大語言模型 Orca-2-13B，只需4個命令行

文章出處：【微信號：Rust語言中文社區，微信公眾號：Rust語言中文社區】歡迎添加關注！文章轉載請注明出處。

OpenAI斷供API，國產大模型替代方案低成本遷移

訪問API服務的國家和地區列表中總計188個國家和地區，不包括中國內地與中國香港。 ? 這意味著，OpenAI宣布終止對中國開發者提供API

發表于 06-27 09:04 ?3492次閱讀

OpenAI攻克Sora視頻創建錯誤率高難題

了更加穩定、高效的視頻創建體驗。 Sora作為一款先進的視頻處理工具，旨在為用戶提供便捷的視頻創作服務。然而，在過去的使用過程中，不少用戶反饋視頻創建錯誤率較高，影響了整體的使用體驗。

發表于 12-31 10:37 ?174次閱讀

OpenAI宣布API恢復運行，ChatGPT正在逐步回歸

近日，OpenAI官方發布了一則重要更新說明，宣布其API系統現已全面恢復運行，同時確認ChatGPT服務正在逐步恢復中。這一消息對于眾多依

發表于 12-28 14:41 ?438次閱讀

OpenAI 發了一個支持 ESP32 的 Realtime API SDK

“ ?昨晚 OpenAI 正式發布了 o3 模型，AI 圈一片沸騰。作為電子工程師的我撓了撓頭，好像和我沒什么直接的關系??倒是 OpenAI 的另一個小發布，讓我很感興趣：

發表于 12-21 11:36 ?4157次閱讀

<b class='flag-5'>OpenAI</b> 發了<b class='flag-5'>一</b><b class='flag-5'>個</b>支持 ESP32 的 Realtime <b class='flag-5'>API</b> SDK

OpenAI暫不推出Sora視頻生成模型API

OpenAI近日宣布，目前暫無推出其視頻生成模型Sora的應用程序接口(API)的計劃。Sora模型能夠基于文本和圖像生成視頻，引發了廣泛關注。然而，由于訪問量遠超預期，OpenAI此前不得不緊急

發表于 12-20 14:23 ?207次閱讀

api驅動的云服務是什么意思？

API驅動的云服務是指利用API技術來驅動和提供云服務的模式。在這種模式下，云服務提供商會公開一

發表于 11-14 10:06 ?249次閱讀

微軟終止中國大陸個人Azure OpenAI服務，為國內大模型帶來機遇

2024年10月17日，微軟公司宣布將在中國大陸地區停止面向個人用戶的Azure OpenAI服務。這一決定緊隨OpenAI于2024年7月宣布終止對中國大陸提供

發表于 10-28 14:17 ?908次閱讀

華納云：使用 WireMock 在開發和測試中模擬 API 服務

是 WireMock 發揮作用的地方。 WireMock 是一個開源工具，可以幫助開發人員創建模擬真實 API 行為的模擬服務器，為開發和測

發表于 10-25 16:46 ?426次閱讀

esp32上使用chatGPT做一些有意思的事情

ChatGPT獲得響應，我們需要進行以下步驟：1、在OpenAI網站上注冊，并在ESP32上安裝必要的庫。 2、在OpenAI API上創建

發表于 10-18 10:04 ?717次閱讀

OpenAI api key獲取并可調用GPT-4.0、GPT-4o、GPT-4omini

OpenAI賬戶驗證電子郵件申請API訪問獲取API Key 配置和使用API Key 1. 注冊OpenAI賬戶首先，你需要

發表于 08-06 15:16 ?3528次閱讀

OpenAI將終止對中國提供API服務

近日，人工智能領域的領軍企業OpenAI通過官方渠道向全球用戶發布了一則重要通知，引起了業界的廣泛關注。自6月24日晚間起，不少中國用戶收到了來自OpenAI的郵件，郵件內容明確指出了其服務

發表于 06-26 18:18 ?1001次閱讀

OpenAI發出警告信：多國開發者面臨API封鎖 OpenAI API解決方案

事件背景 2024年7月9日，OpenAI宣布將封鎖對不支持國家的API訪問，許多開發者因此收到了警告信。這一決定引起了廣泛的關注和討論，尤其是在那些受影響的國家和地區。警告信的內容 Ope

發表于 06-26 11:29 ?1613次閱讀

OpenAI API Key獲取：開發人員申請GPT-4 API Key教程

? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力，成為了許多開發者的首選工具。獲取GPT-4 API Key并將其應用于項目，如開發一個ChatGPT聊天應用，不僅是實

發表于 06-24 17:40 ?2539次閱讀

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

當地時間5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎上，這種迭代擁有顯著的改進。在發布會的演示中，OpenAI展示

發表于 05-27 15:43

OpenAI API Key獲取與充值教程：助開發者解鎖GPT-4.0 API

OpenAI 的 API Key，以及如何使用這個 Key 來調用 GPT-4.0 API。第一步：獲取 OpenAI

發表于 04-28 16:35 ?1.1w次閱讀

那曲檬骨新材料有限公司

搜索歷史

如何為Orca-2-13B創建一個與OpenAI兼容的API服務呢？

評論

OpenAI斷供API，國產大模型替代方案低成本遷移

OpenAI攻克Sora視頻創建錯誤率高難題

OpenAI宣布API恢復運行，ChatGPT正在逐步回歸

OpenAI 發了一個支持 ESP32 的 Realtime API SDK

OpenAI暫不推出Sora視頻生成模型API

api驅動的云服務是什么意思？

微軟終止中國大陸個人Azure OpenAI服務，為國內大模型帶來機遇

華納云：使用 WireMock 在開發和測試中模擬 API 服務

esp32上使用chatGPT做一些有意思的事情

OpenAI api key獲取并可調用GPT-4.0、GPT-4o、GPT-4omini

OpenAI將終止對中國提供API服務

OpenAI發出警告信：多國開發者面臨API封鎖 OpenAI API解決方案

OpenAI API Key獲取：開發人員申請GPT-4 API Key教程

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

OpenAI API Key獲取與充值教程：助開發者解鎖GPT-4.0 API