国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

當(dāng)前位置: 首頁 > news >正文

參考消息電子版手機(jī)版網(wǎng)站優(yōu)化方法

參考消息電子版手機(jī)版,網(wǎng)站優(yōu)化方法,wordpress對(duì)比phpcms,兩個(gè)網(wǎng)站php 一個(gè)空間摘要: 量化方案基于AutoGPTQ,提供了Int4量化模型,其中包括Qwen-7B-Chat和Qwen-14B-Chat。更新承諾在模型評(píng)估效果幾乎沒有損失的情況下,降低存儲(chǔ)要求并提高推理速度。量化是指將模型權(quán)重和激活的精度降低以節(jié)省存儲(chǔ)空間并提高推理速度的過程。AutoGPTQ是一種專有量化工具?!?article class="baidu_pl">

摘要:

量化方案基于AutoGPTQ,提供了Int4量化模型,其中包括Qwen-7B-Chat和Qwen-14B-Chat。更新承諾在模型評(píng)估效果幾乎沒有損失的情況下,降低存儲(chǔ)要求并提高推理速度。量化是指將模型權(quán)重和激活的精度降低以節(jié)省存儲(chǔ)空間并提高推理速度的過程。AutoGPTQ是一種專有量化工具。Int4是指4位整數(shù)量化,與傳統(tǒng)的8位量化相比,可以進(jìn)一步減少存儲(chǔ)要求。

如何使用Int4量化模型

在開始使用前,請(qǐng)先保證滿足要求(如torch 2.0及以上,transformers版本為4.32.0及以上,等等),并安裝所需安裝包:

pip install auto-gptq optimum

 【Auto-GPT 】

AutoGPTQ將能夠作為一個(gè)可擴(kuò)展、靈活的量化后端,支持所有類似GPTQ的方法,并自動(dòng)量化由Pytorch編寫的LLM。說白了就是讓模型能夠輕量化。

┏ (゜ω゜)=??傳送門==>GitHub - PanQiWei/AutoGPTQ: An easy-to-use LLMs quantization package with user-friendly apis, based on GPTQ algorithm.

 https://huggingface.co/blog/zh/gptq-integration

問題:ModuleNotFoundError: No module named 'optimum.gptq'的處理方法

在python環(huán)境下使用如下代碼,查看是否安裝這個(gè)模塊

import pkg_resourcestry:pkg_resources.get_distribution('optimum')print('optimum is installed.')# Check if gptq is installed under optimumtry:pkg_resources.get_distribution('optimum.gptq')print('gptq is installed under optimum.')except pkg_resources.DistributionNotFound:print('gptq is not installed under optimum.')
except pkg_resources.DistributionNotFound:print('optimum is not installed.')

我這里返回了

optimum is installed.
gptq is not installed under optimum.

看來,我是安裝了【optimum】這個(gè)模塊,但是下面的【gptq】沒有安裝

通過pip list指令,我也找到所裝的optimum版本

 Optimum 是 Transformers 的擴(kuò)展,它提供了一組性能優(yōu)化工具,可以在目標(biāo)硬件上以最高效率訓(xùn)練和運(yùn)行模型。

【解決方法】 

刪除,從Git上clone下(clone地址==>https://github.com/huggingface/optimum),再安裝optimum。這次通過在clone的本地路徑下,通過指令【python setup.py install】去安裝。發(fā)現(xiàn)optimum文件夾下有了gptq這個(gè)模塊

 離線運(yùn)行一下量化后的模型

首先還是將模型文件下載到本地,用YOURPATH去保存你的模型文件所在的相對(duì)路徑。

from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfigYOURPATH = 'models/Qwen-7B-Chat-Int'
# name = 'Qwen/Qwen-7B-Chat-Int'
tokenizer = AutoTokenizer.from_pretrained(YOURPATH, local_files_only=True,trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(YOURPATH, local_files_only=True, device_map="auto", trust_remote_code=True).eval()
http://aloenet.com.cn/news/47074.html

相關(guān)文章:

  • 建設(shè)銀行網(wǎng)站查詢密碼怎么設(shè)置最新網(wǎng)站查詢工具
  • 科技公司網(wǎng)站主頁設(shè)計(jì)網(wǎng)絡(luò)營銷網(wǎng)站平臺(tái)有哪些
  • 常州網(wǎng)站設(shè)計(jì)制作推廣類軟文
  • 江陰做網(wǎng)站的地方企業(yè)網(wǎng)站建設(shè)規(guī)劃
  • 母嬰網(wǎng)站怎么做中國十大網(wǎng)絡(luò)銷售公司
  • 網(wǎng)站每日簽到怎么做大一html網(wǎng)頁制作
  • 汕頭澄海招聘網(wǎng)搜索引擎優(yōu)化期末考試答案
  • 南京網(wǎng)站開發(fā)注冊(cè)app國外直播平臺(tái)tiktok
  • 網(wǎng)站廣告費(fèi)一般多少錢網(wǎng)頁生成app
  • 在本地用dedecms做好的網(wǎng)站如何上傳到服務(wù)器?外貿(mào)網(wǎng)站平臺(tái)都有哪些
  • 六安網(wǎng)站建設(shè)企業(yè)seo優(yōu)化系統(tǒng)
  • 全景網(wǎng)站如何建設(shè)站長之家
  • 藍(lán)韻官方網(wǎng)站海外aso優(yōu)化
  • php自適應(yīng)網(wǎng)站最近發(fā)生的新聞
  • 網(wǎng)站建設(shè)知識(shí)百度官方網(wǎng)站下載安裝
  • 做除塵環(huán)保的如何推廣自己的網(wǎng)站seo收錄查詢工具
  • 2022年最新血糖標(biāo)準(zhǔn)權(quán)威發(fā)布徐州seo外包
  • 上海平臺(tái)網(wǎng)站制作公司新東方在線網(wǎng)上課程
  • 找做網(wǎng)站的朋友短視頻營銷成功的案例
  • 網(wǎng)站正在建設(shè)中 html企業(yè)培訓(xùn)有哪些方面
  • 企業(yè)加盟網(wǎng)站建設(shè)百家號(hào)權(quán)重查詢站長工具
  • 哈爾濱網(wǎng)站備案手續(xù)費(fèi)廣告聯(lián)盟官網(wǎng)
  • web前端設(shè)計(jì)模板seo優(yōu)化師是什么
  • 郴州建網(wǎng)站百度熱搜seo
  • 哪里網(wǎng)站開發(fā)好國產(chǎn)免費(fèi)crm系統(tǒng)有哪些在線
  • 騰訊云動(dòng)態(tài)加速WordPress網(wǎng)站頁面怎么優(yōu)化
  • 裝修設(shè)計(jì)網(wǎng)站哪個(gè)好前端性能優(yōu)化有哪些方法
  • 網(wǎng)站建設(shè)教程模板網(wǎng)站排名seo軟件
  • 仿 wordpress簡述seo的應(yīng)用范圍
  • 電腦關(guān)鍵字被限制 購物網(wǎng)站明星百度指數(shù)在線查詢