為什么選php語言做網(wǎng)站手機(jī)百度網(wǎng)盤下載慢怎么解決
最近抖音剪映發(fā)布了圖文生成視頻功能,同時(shí)百家號也有這個(gè)功能,這個(gè)可以看做是一個(gè)開源的實(shí)現(xiàn),一起看看它的原理吧~
一句話提示詞 | 大模型生成文案 | 百家號生成視頻效果 | MoneyPrinterTurbo生成視頻效果 |
天空為什么是藍(lán)色的? | 天空之所以呈現(xiàn)藍(lán)色,是因?yàn)榇髿庵械姆肿雍托×W訒⑸涮柟庵械乃{(lán)色光線比其他顏色更多。這種現(xiàn)象稱為“瑞利散射”。太陽光是由不同顏色的光線組成的,這些顏色的光線混合在一起形成了白光。在地球的大氣中,較短的波長,如藍(lán)色和紫色,比較長的波長,如紅色和橙色,更容易被散射。然而,我們的眼睛對藍(lán)色光線的敏感度更高,因此我們看到的天空大部分時(shí)間都是藍(lán)色的。此外,當(dāng)太陽接近地平線時(shí),光線需要穿越更多的大氣層,這使得更多的藍(lán)色和綠色光線被散射掉,留下的主要是紅色和橙色,這就是為什么日落和日出時(shí)天空會呈現(xiàn)出紅色或橙色的原因。 | 天空為什么是藍(lán)色的? | 天空為什么是藍(lán)的MPT生成 |
一、項(xiàng)目說明
利用AI大模型,一鍵生成高清短視頻:只需提供一個(gè)視頻 主題 或 關(guān)鍵詞 ,就可以全自動生成視頻文案、視頻素材、視頻字幕、視頻背景音樂,然后合成一個(gè)高清的短視頻。
1.功能特性
-
完整的MVC架構(gòu),代碼結(jié)構(gòu)清晰,易于維護(hù),支持
API
和Web界面
-
支持視頻文案AI自動生成,也可以自定義文案
-
支持多種高清視頻尺寸
-
豎屏 9:16,
1080x1920
-
橫屏 16:9,
1920x1080
-
-
支持批量視頻生成,可以一次生成多個(gè)視頻,然后選擇一個(gè)最滿意的
-
支持視頻片段時(shí)長設(shè)置,方便調(diào)節(jié)素材切換頻率
-
支持中文和英文視頻文案
-
支持多種語音合成
-
支持字幕生成,可以調(diào)整
字體
、位置
、顏色
、大小
,同時(shí)支持字幕描邊
設(shè)置 -
支持背景音樂,隨機(jī)或者指定音樂文件,可設(shè)置
背景音樂音量
-
視頻素材來源高清,而且無版權(quán)
-
支持OpenAI、moonshot、Azure、gpt4free、one-api、通義千問、Google Gemini、Ollama等多種模型接入
2.后期計(jì)劃
-
GPT-SoVITS 配音支持
-
優(yōu)化語音合成,利用大模型,使其合成的聲音,更加自然,情緒更加豐富
-
增加視頻轉(zhuǎn)場效果,使其看起來更加的流暢
-
增加更多視頻素材來源,優(yōu)化視頻素材和文案的匹配度
-
增加視頻長度選項(xiàng):短、中、長
-
打包成一鍵啟動包(Windows,macOS),方便使用
-
增加免費(fèi)網(wǎng)絡(luò)代理,讓訪問OpenAI和素材下載不再受限
-
可以使用自己的素材
-
朗讀聲音和背景音樂,提供實(shí)時(shí)試聽
-
支持更多的語音合成服務(wù)商,比如 OpenAI TTS, Azure TTS
-
自動上傳到Y(jié)ouTube平臺
二.安裝部署
1.安裝
-
盡量不要使用 中文路徑,避免出現(xiàn)一些無法預(yù)料的問題
-
請確保你的 網(wǎng)絡(luò) 是正常的,VPN需要打開
全局流量
模式
① 克隆代碼
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
② 修改配置文件
-
將
config.example.toml
文件復(fù)制一份,命名為config.toml
-
按照
config.toml
文件中的說明,配置好pexels_api_keys
和llm_provider
,并根據(jù) llm_provider 對應(yīng)的服務(wù)商,配置相關(guān)的 API Key
③ 配置大模型(LLM)
-
如果要使用
GPT-4.0
或GPT-3.5
,需要有OpenAI
的API Key
,如果沒有,可以將llm_provider
設(shè)置為g4f
( 一個(gè)免費(fèi)使用GPT的開源庫 https://github.com/xtekky/gpt4free ,但是該免費(fèi)的服務(wù),穩(wěn)定性較差,有時(shí)候可以用,有時(shí)候用不了) -
或者可以使用到 月之暗面 申請。注冊就送 15元體驗(yàn)金,可以對話1500次左右。然后設(shè)置
llm_provider="moonshot"
和moonshot_api_key
-
也可以使用 通義千問,具體請看配置文件里面的注釋說明
2.部署
① 創(chuàng)建虛擬環(huán)境
建議使用conda創(chuàng)建 python 虛擬環(huán)境
git clone https://github.com/harry0703/MoneyPrinterTurbo.gitcd MoneyPrinterTurboconda create -n MoneyPrinterTurbo python=3.10conda activate MoneyPrinterTurbopip install -r requirements.txt
② 安裝好 ImageMagick
Windows:
-
下載https://imagemagick.org/archive/binaries/ImageMagick-7.1.1-29-Q16-x64-static.exe
-
安裝下載好的 ImageMagick,注意不要修改安裝路徑
-
修改
配置文件 config.toml
中的imagemagick_path
為你的實(shí)際安裝路徑(如果安裝的時(shí)候沒有修改路徑,直接取消注釋即可)
MacOS:
brew install imagemagick
Ubuntu:
sudo apt-get install imagemagick
CentOS:
sudo yum install ImageMagick
③ 啟動Web界面
注意需要到 MoneyPrinterTurbo 項(xiàng)目根目錄
下執(zhí)行以下命令
Windows:
conda activate MoneyPrinterTurbowebui.bat
MacOS or Linux:
conda activate MoneyPrinterTurbosh webui.sh
啟動后,會自動打開瀏覽器
④ 啟動API服務(wù)
python main.py
啟動后,可以查看API文檔
http://127.0.0.1:8080/docs或者h(yuǎn)ttp://127.0.0.1:8080/redoc直接在線調(diào)試接口,快速體驗(yàn)
三.源碼剖析
1.開發(fā)框架
-
UI:Streamlit ? A faster way to build and share data apps
-
OpenAPI:FastAPI
2.參數(shù)解析
{"video_subject": "string", ## 視頻主題,必選"video_script": "", ## 視頻腳本,可以為空,為空則LLM生成"video_terms": "string", ## 視頻搜索詞列表,英文,可以為空,為空則LLM生成"video_aspect": "9:16", ## 視頻寬高比,支持:"16:9""9:16""1:1""video_concat_mode": "random", ## 視頻拼接方式,支持:"random""sequential""video_clip_duration": 5, ## 視頻剪輯持續(xù)時(shí)長,默認(rèn)5,小于此時(shí)長的視頻不會被下載"video_count": 1, ## 視頻生成個(gè)數(shù),默認(rèn)1"video_language": "", ## 視頻語言"voice_name": "", ## 配音人名稱"voice_volume": 1, ## 配音音量,默認(rèn)1"bgm_type": "random", ## 背景音樂選擇類型,