从 SharePoint 下载录像视频,并使用 Amazon Transcribe 进行转译。
by Kiro
|
|
1 kuukausi sitten | |
|---|---|---|
| sp-transcribe-service | 1 kuukausi sitten | |
| .gitignore | 1 kuukausi sitten | |
| README.md | 1 kuukausi sitten | |
| simplify_transcript.py | 1 kuukausi sitten | |
| sp-stream-helper.user.js | 1 kuukausi sitten | |
| sp_video_dl.py | 1 kuukausi sitten |
从 SharePoint Online / Microsoft Stream 下载会议录像等视频。
SharePoint Stream 使用 DASH 协议播放视频:
videomanifest API 获取 MPD manifest(包含视频/音频分段信息)x-spopactoken(PAC token)用于 manifest,FedAuth HttpOnly cookie 用于 segmentVideoProtectionKey API 获取pip install requests pycryptodome
合并音视频需要 ffmpeg。
videomanifestOPTIONS(预检)— 不要复制这个GET(实际请求)— 复制这个curl_command.txtSharePoint 的 FedAuth/rtFa 是 HttpOnly cookie,document.cookie 拿不到。
cookies.jsonpython sp_video_dl.py curl_command.txt -c cookies.json -o my_video
| 参数 | 说明 |
|---|---|
input |
cURL 命令文件路径,或交互模式粘贴 |
-c, --cookie |
Cookie JSON 文件或字符串 |
-o, --output |
输出目录(默认 output) |
-w, --workers |
并发线程数(默认 4) |
--dry-run |
仅解析 manifest,不下载 |
脚本会自动检测并提示。确保复制的是 Method 为 GET 的请求(headers 里有 x-spopactoken: v1.eyJ...)。
缺少 HttpOnly cookie。用 Cookie-Editor 扩展导出 JSON,通过 -c cookies.json 传入。
SharePoint cookie 有效期通常几小时。过期后重新从浏览器导出。
视频和音频文件已分别保存在输出目录,手动合并:
ffmpeg -y -i my_video/video.mp4 -i my_video/audio.mp4 -c copy my_video/final.mp4
| 文件 | 说明 |
|---|---|
final.mp4 |
合并后的完整视频 |
video.mp4 |
视频轨道 |
audio.mp4 |
音频轨道 |
transcript.json |
原始转录数据 (JSON) |
transcript.srt |
SRT 字幕文件 |
transcript.txt |
纯文本转录 (带说话人和时间戳) |
manifest.mpd |
DASH manifest |