Qwen3跨平台GUI开发：基于Qt框架打造桌面级字幕对齐工具

张开发

• 2026/4/12 12:09:52 • 15 分钟阅读

分享文章

Qwen3跨平台GUI开发基于Qt框架打造桌面级字幕对齐工具1. 引言做视频的朋友们不知道你们有没有遇到过这样的烦恼辛辛苦苦剪完片子最后卡在字幕对齐上。要么是字幕比画面快半秒要么是慢半拍手动一帧一帧调整眼睛都快看花了。更头疼的是如果视频有好几种语言的字幕那工作量简直让人崩溃。传统的字幕工具要么功能太简单要么操作太复杂很多还得依赖命令行。对于不熟悉代码的创作者来说这无疑是一道高高的门槛。我们能不能做一个既强大又好用的工具让字幕对齐这件事变得像拖拽文件一样简单这就是我们今天要聊的用Qt框架为Qwen3语音识别服务打造一个跨平台的桌面级字幕对齐工具。你不用懂命令行不用写代码只需要点点鼠标就能完成从视频到精准时间轴字幕的全过程。无论你用Windows、macOS还是Linux都能获得一致的流畅体验。2. 为什么选择Qt和Qwen3在动手之前我们先聊聊为什么是这两个技术组合。Qt框架简单来说就是一个能让你用同一套代码做出在Windows、Mac、Linux上都能运行的软件界面的工具包。它的界面组件丰富文档齐全社区活跃对于开发桌面应用来说是个非常成熟的选择。用Python的PyQt或者PySide库来写上手速度也很快。Qwen3则是我们处理音频、生成字幕的“大脑”。它背后的语音识别能力相当出色不仅能准确地把视频里的对话转成文字还能比较好地处理不同口音、背景噪音。更重要的是它提供了方便的API接口我们的程序可以很容易地调用它。把这两者结合起来Qt负责打造一个好看、好用的“外壳”Qwen3负责核心的“听写”工作。这样一来用户只需要面对一个直观的图形界面所有复杂的后台处理都交给程序自动完成。3. 工具核心功能设计一个好的工具功能不在于多而在于准。我们这个字幕对齐工具主要围绕视频创作者的真实工作流来设计。3.1 一站式文件管理你不再需要记住视频文件放在哪个文件夹。工具会提供一个清晰的文件浏览器支持直接拖拽视频文件到界面。常见的MP4、MOV、AVI格式都能直接识别和预览。3.2 实时视频与音频预览在正式处理前你可以先播放视频确认内容。更重要的是工具会提取并显示音频波形图。这个波形图非常有用你能直观地看到哪里有人声高峰通常是对白开始这为后续手动微调字幕提供了视觉参考。3.3 无缝对接Qwen3服务这是工具的核心。你只需要在设置里填入可用的Qwen3 API密钥和端点地址如果你在本地部署了服务也可以用本地地址。点击“开始识别”后工具会自动提取视频音轨发送给Qwen3并把返回的文字结果和时间戳实时显示在界面上。3.4 可视化字幕编辑与对齐识别出来的字幕会以一条条时间块的形式显示在下方的时间轴上。你可以用鼠标直接拖动时间块的边缘来调整字幕的开始和结束时间就像在剪辑软件里修剪视频片段一样直观。双击字幕块还能直接修改文字内容。3.5 灵活导出与格式支持字幕调整满意后一键导出。工具支持导出为最通用的SRT格式以及ASS/SSA这种支持样式的高级格式。导出的文件可以直接导入到剪映、Premiere、Final Cut Pro等主流剪辑软件中使用。整个设计思路就是隐藏所有技术细节把复杂的功能包装成最简单的操作。4. 开发实战从零搭建应用界面理论说完了我们来看看具体怎么用PyQtPython版的Qt把这个界面搭起来。我会用一些关键的代码片段带你走一遍核心流程。首先你需要安装必要的库pip install PyQt5 moviepy openai-whisper openai # 示例中可能用到相关库请根据实际Qwen3 SDK调整4.1 创建主窗口与基本布局我们从一个简单的窗口开始划分出几个主要区域菜单栏、工具栏、视频预览区、字幕列表区和时间轴区。import sys from PyQt5.QtWidgets import (QApplication, QMainWindow, QWidget, QVBoxLayout, QHBoxLayout, QPushButton, QLabel, QListWidget, QSlider) from PyQt5.QtCore import Qt, QUrl from PyQt5.QtMultimedia import QMediaPlayer, QMediaContent from PyQt5.QtMultimediaWidgets import QVideoWidget class SubtitleTool(QMainWindow): def __init__(self): super().__init__() self.setWindowTitle(Qwen3 字幕对齐工具) self.setGeometry(100, 100, 1200, 700) # 创建中心部件和主布局 central_widget QWidget() self.setCentralWidget(central_widget) main_layout QVBoxLayout(central_widget) # 1. 顶部工具栏区域 toolbar_layout QHBoxLayout() self.btn_open QPushButton(打开视频) self.btn_process QPushButton(识别字幕) self.btn_export QPushButton(导出字幕) toolbar_layout.addWidget(self.btn_open) toolbar_layout.addWidget(self.btn_process) toolbar_layout.addWidget(self.btn_export) toolbar_layout.addStretch() # 添加弹性空间 main_layout.addLayout(toolbar_layout) # 2. 中间内容区域视频预览字幕列表 content_widget QWidget() content_layout QHBoxLayout(content_widget) # 视频预览区域 video_container QWidget() video_layout QVBoxLayout(video_container) self.video_label QLabel(视频预览区) self.video_label.setMinimumSize(640, 360) self.video_label.setStyleSheet(border: 1px solid #ccc; background-color: #000;) video_layout.addWidget(self.video_label) # 播放控制条 control_layout QHBoxLayout() self.play_btn QPushButton(播放) self.time_slider QSlider(Qt.Horizontal) control_layout.addWidget(self.play_btn) control_layout.addWidget(self.time_slider) video_layout.addLayout(control_layout) content_layout.addWidget(video_container, 3) # 占比3份 # 字幕列表区域 subtitle_container QWidget() subtitle_layout QVBoxLayout(subtitle_container) subtitle_layout.addWidget(QLabel(字幕列表)) self.subtitle_list QListWidget() subtitle_layout.addWidget(self.subtitle_list) content_layout.addWidget(subtitle_container, 1) # 占比1份 main_layout.addWidget(content_widget, 4) # 中间区域占主要空间 # 3. 底部时间轴区域 timeline_label QLabel(时间轴编辑区 (此处可放置自定义的时间轴控件)) timeline_label.setMinimumHeight(100) timeline_label.setStyleSheet(border: 1px solid #ccc; background-color: #f0f0f0;) main_layout.addWidget(timeline_label, 1) # 连接按钮信号 self.btn_open.clicked.connect(self.open_video_file) self.btn_process.clicked.connect(self.process_audio) self.btn_export.clicked.connect(self.export_subtitles) def open_video_file(self): # 这里会实现打开文件对话框并加载视频的逻辑 print(打开视频文件...) def process_audio(self): # 这里会实现调用Qwen3 API进行语音识别的逻辑 print(开始处理音频并识别字幕...) def export_subtitles(self): # 这里会实现导出字幕文件的逻辑 print(导出字幕文件...) if __name__ __main__: app QApplication(sys.argv) window SubtitleTool() window.show() sys.exit(app.exec_())这段代码搭建了一个最基础的框架。顶部是操作按钮中间左边放视频右边显示字幕文本列表底部预留了时间轴区域。你可以先运行看看一个桌面应用的骨架就出来了。4.2 集成视频播放与波形显示要让视频真正播起来我们需要用到Qt的多媒体模块。同时为了给字幕对齐提供参考显示音频波形是关键一步。# 假设我们已经有了一个提取音频并生成波形数据的函数 # 这里重点展示如何将波形图集成到界面中 class WaveformWidget(QWidget): 一个简单的自定义控件用于绘制音频波形 def __init__(self, parentNone): super().__init__(parent) self.waveform_data [] # 存储波形数据点 self.setMinimumHeight(80) def set_waveform_data(self, data): 设置波形数据并重绘 self.waveform_data data self.update() # 触发重绘事件 def paintEvent(self, event): 重写绘制事件画出波形 if not self.waveform_data: return painter QPainter(self) painter.setRenderHint(QPainter.Antialiasing) width self.width() height self.height() center_y height // 2 # 设置画笔颜色 painter.setPen(QPen(QColor(70, 130, 180), 1)) # 钢蓝色 # 绘制波形线 data_length len(self.waveform_data) for i in range(width): data_index int(i * data_length / width) if data_index data_length: # 将音频数据值映射到绘制高度 value self.waveform_data[data_index] line_height int(value * center_y) painter.drawLine(i, center_y - line_height, i, center_y line_height) # 绘制中心线 painter.setPen(QPen(QColor(200, 200, 200), 1, Qt.DashLine)) painter.drawLine(0, center_y, width, center_y) # 在主窗口初始化中加入波形控件 # 在视频预览区域下方添加 self.waveform WaveformWidget() video_layout.addWidget(self.waveform)波形图能让你直观地“看到”声音人声出现的地方通常会有明显的峰值这比单纯听声音更容易定位。4.3 实现字幕时间轴拖动编辑这是工具的灵魂功能。我们需要一个可以交互的时间轴让用户能直接拖动调整字幕的时间。# 这是一个高度简化的时间轴控件概念示例 # 实际开发中你可能需要继承QWidget并处理鼠标事件来实现更复杂的功能 class TimelineWidget(QWidget): def __init__(self, parentNone): super().__init__(parent) self.subtitle_segments [] # 存储字幕片段[开始时间(秒), 结束时间(秒), 文本] self.setMinimumHeight(120) def add_subtitle_segment(self, start_time, end_time, text): 添加一个字幕片段到时间轴 self.subtitle_segments.append([start_time, end_time, text]) self.update() def paintEvent(self, event): 绘制时间轴和字幕块 painter QPainter(self) painter.fillRect(self.rect(), QColor(245, 245, 245)) width self.width() total_duration 60 # 假设视频总时长60秒实际应从视频获取 # 绘制时间刻度 painter.setPen(QColor(150, 150, 150)) for i in range(0, int(total_duration)1, 5): # 每5秒一个刻度 x_pos int(i * width / total_duration) painter.drawLine(x_pos, 0, x_pos, 15) painter.drawText(x_pos - 10, 30, f{i}s) # 绘制字幕块 painter.setBrush(QColor(100, 180, 255, 180)) # 半透明蓝色 painter.setPen(QColor(50, 120, 200)) for start, end, text in self.subtitle_segments: start_x int(start * width / total_duration) end_x int(end * width / total_duration) block_width end_x - start_x # 绘制矩形块 painter.drawRect(start_x, 50, block_width, 40) # 绘制文字简单裁剪 if block_width 20: painter.drawText(start_x 5, 75, text[:10] (... if len(text) 10 else )) def mousePressEvent(self, event): 简单的鼠标点击检测实际需要更复杂的逻辑来处理拖动 if event.button() Qt.LeftButton: x_pos event.x() width self.width() total_duration 60 clicked_time x_pos * total_duration / width print(f点击了时间轴位置{clicked_time:.2f}秒) # 这里可以添加逻辑来选中或拖动某个字幕块在实际开发中你需要处理鼠标的按下、移动、释放事件来计算字幕块被拖动了多少时间并实时更新字幕数据。虽然代码量会上去但原理就是通过鼠标位置换算成时间然后更新对应字幕条目的开始或结束时间。5. 核心逻辑连接Qwen3服务界面搭好了接下来就是让工具“聪明”起来连接Qwen3的语音识别服务。5.1 配置与调用语音识别API我们需要一个地方让用户配置API信息然后编写调用逻辑。# 在主窗口中添加一个设置对话框或侧边栏来配置API # 这里展示一个简单的配置存储和调用函数 class APIManager: 管理Qwen3 API配置和调用 def __init__(self): self.api_key self.api_base https://dashscope.aliyuncs.com/compatible-mode/v1 # 示例地址请以官方为准 def set_config(self, api_key, api_baseNone): self.api_key api_key if api_base: self.api_base api_base def transcribe_audio(self, audio_file_path): 调用语音识别API转写字幕 if not self.api_key: return None, 请先配置API密钥 try: # 注意以下为示例代码实际调用方式需参考Qwen3最新API文档 # 通常需要将音频文件读取并编码通过HTTP请求发送 import requests headers { Authorization: fBearer {self.api_key}, Content-Type: application/json } # 1. 读取音频文件 with open(audio_file_path, rb) as f: audio_data f.read() # 2. 构建请求假设API支持base64编码的音频数据 import base64 audio_b64 base64.b64encode(audio_data).decode(utf-8) payload { model: qwen-audio, # 假设的模型名请以官方文档为准 audio: fdata:audio/wav;base64,{audio_b64}, response_format: verbose_json # 获取带时间戳的详细结果 } # 3. 发送请求 response requests.post( f{self.api_base}/audio/transcriptions, headersheaders, jsonpayload, timeout30 ) if response.status_code 200: result response.json() # 解析结果提取文本和时间戳 segments result.get(segments, []) subtitles [] for seg in segments: subtitles.append({ start: seg.get(start, 0), end: seg.get(end, 0), text: seg.get(text, ).strip() }) return subtitles, 识别成功 else: return None, fAPI调用失败: {response.status_code} except Exception as e: return None, f处理过程中出错: {str(e)} # 在主窗口中使用 class SubtitleTool(QMainWindow): def __init__(self): # ... 其他初始化代码 ... self.api_manager APIManager() def process_audio(self): if not self.video_path: self.show_message(请先打开一个视频文件) return # 1. 提取视频中的音频 audio_path self.extract_audio_from_video(self.video_path) # 2. 调用API识别 self.show_message(正在识别音频请稍候...) subtitles, message self.api_manager.transcribe_audio(audio_path) # 3. 处理结果 if subtitles: self.show_message(f识别完成共{len(subtitles)}条字幕) self.display_subtitles(subtitles) else: self.show_message(f识别失败: {message})这段代码展示了核心的调用流程提取音频 - 准备数据 - 调用API - 解析结果。你需要根据Qwen3语音识别API的实际接口文档调整请求的格式和参数。5.2 解析结果并生成字幕列表API返回的通常是带时间戳的文本段落。我们需要将其转换成工具内部的数据结构并显示在列表和时间轴上。def display_subtitles(self, subtitle_data): 将识别结果显示到列表和时间轴 # 清空现有内容 self.subtitle_list.clear() self.timeline_widget.clear() # 假设时间轴控件有clear方法 for i, item in enumerate(subtitle_data): start_time item[start] end_time item[end] text item[text] # 格式化时间显示 (00:00:00,000) start_str self.format_time(start_time) end_str self.format_time(end_time) # 添加到列表控件 list_item f[{start_str} -- {end_str}] {text} self.subtitle_list.addItem(list_item) # 添加到时间轴控件 self.timeline_widget.add_subtitle_segment(start_time, end_time, text) def format_time(self, seconds): 将秒数格式化为 SRT 时间格式 (HH:MM:SS,mmm) hours int(seconds // 3600) minutes int((seconds % 3600) // 60) secs int(seconds % 60) millisecs int((seconds - int(seconds)) * 1000) return f{hours:02d}:{minutes:02d}:{secs:02d},{millisecs:03d}6. 进阶功能与优化思路基础功能跑通后我们可以考虑加入一些让工具更好用的“加分项”。批量处理对于做系列视频或长视频的创作者可以增加一个批量处理模式。选择一个文件夹工具自动处理其中的所有视频文件并统一导出字幕。多语言支持Qwen3支持多种语言的语音识别。可以在界面上加一个下拉框让用户选择视频的语言如中文、英文、日语这样识别准确率会更高。智能断句与合并有时候API返回的句子片段太短或太长。可以加入一个后处理功能根据标点符号、停顿时间或句子长度自动合并过短的片段或者分割过长的句子让字幕显示更舒适。快捷键支持为常用操作如播放/暂停、跳转到上/下一条字幕设置键盘快捷键能极大提升编辑效率。样式模板对于ASS/SSA格式可以提供几个预设的字幕样式模板如不同的字体、大小、颜色、位置用户一键应用不用每次都手动设置样式代码。7. 打包与分发应用开发完成后你肯定希望把它分享给其他人使用。这就需要打包成独立的可执行文件。对于Python程序PyInstaller是一个常用的工具。它可以把你写的代码、用到的库以及Python解释器本身一起打包成一个.exeWindows或.appmacOS文件。# 安装 PyInstaller pip install pyinstaller # 基本打包命令 (在项目目录下执行) pyinstaller --onefile --windowed --nameSubtitleAlignTool main.py # 更完整的命令可以添加图标和排除不必要的库 pyinstaller --onefile --windowed --nameSubtitleAlignTool --iconapp.ico --add-dataui/*;ui/ --hidden-importPyQt5.sip main.py打包后你会得到一个独立的可执行文件。用户不需要安装Python或任何库双击就能运行。记得在不同操作系统Windows、macOS、Linux上分别打包测试确保跨平台兼容性。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章

前端开发 2026/4/12 12:08:03

实战指南：5个技巧高效使用计算机视觉特征匹配基准数据集

实战指南：5个技巧高效使用计算机视觉特征匹配基准数据集【免费下载链接】hpatches-dataset HPatches: Homography-patches dataset. 项目地址: https://gitcode.com/gh_mirrors/hp/hpatches-dataset 在计算机视觉和图像处理研究领域，特征匹配算法…

张开发

前端开发 2026/4/12 12:07:38

写算法香水试香卡镂空导流更入味，输出:美妆店/专柜小物料。

一、实际应用场景描述在美妆店、商场专柜中，香水试香卡（闻香纸）是最常见的引流小物料：- 顾客路过，随手一抽- 轻喷香水，几秒闻香- 带走品牌记忆但传统试香卡存在明显局限：- 纸片平整，…

张开发

前端开发 2026/4/12 12:03:24

Cesium进阶实战：粒子系统动态属性交互控制面板开发

1. 粒子系统交互控制面板开发背景在三维可视化项目中，粒子系统是营造沉浸式体验的利器。记得我第一次用Cesium实现飞机尾迹效果时，手动调整代码参数的方式简直让人崩溃——每次修改都要重新编译，调试过程像在开盲盒。后来发现用Vue 3 TypeS…

张开发

前端开发 2026/4/12 12:03:12

Lychee模型在遥感图像分析中的创新应用

Lychee模型在遥感图像分析中的创新应用 1. 引言：遥感技术的智能化挑战遥感技术已经深入我们生活的方方面面，从城市规划到农业生产，从环境监测到灾害预警。但面对海量的卫星图像和地理信息数据，传统的人工分析方法显得力不从心。…

张开发

前端开发 2026/4/12 12:01:35

Pixel Epic · Wisdom Terminal 代码助手深度体验：对比Claude Code与本地化部署优势

Pixel Epic Wisdom Terminal 代码助手深度体验：对比Claude Code与本地化部署优势 1. 开篇：代码助手的新选择在软件开发领域，代码助手已经成为提升开发效率的重要工具。最近我在星图GPU平台上本地部署了Pixel Epic Wisdom Terminal模型&a…

张开发

前端开发 2026/4/12 12:00:52

VS Code 自定义字体全攻略：从安装到优化

1. 为什么需要自定义VS Code字体？ 作为一个每天要和代码打交道的开发者，我深刻体会到编辑器字体对工作效率的影响。默认的Consolas字体虽然中规中矩，但看久了容易视觉疲劳。去年团队里有个同事换了Fira Code字体后，突然发现他debu…

张开发

前端开发 2026/4/12 11:59:33

保姆级教程：用WebRTC-streamer在5分钟内搭建RTSP摄像头监控系统（含Docker配置）

WebRTC-streamer实战指南：5分钟构建低延迟摄像头监控系统在物联网和安防监控领域，实时视频流的低延迟传输一直是技术难点。传统RTSP摄像头在浏览器中播放时，往往面临高延迟、兼容性差等问题。本文将介绍如何利用WebRTC-streamer这一开源工具…

张开发

前端开发 2026/4/12 11:58:14

Transformer原理详解与LiuJuan20260223Zimage模型调优实践

Transformer原理详解与LiuJuan20260223Zimage模型调优实践 1. 引言如果你对AI模型，特别是那些能生成图片、理解文字的模型感到好奇，想知道它们内部到底是怎么“思考”的，那么这篇文章就是为你准备的。我们常常听说“Transformer”是当今许…

张开发

前端开发 2026/4/12 11:55:25

造相-Z-Image-Turbo亚洲美女LoRA教程：LoRA模型热更新不中断服务方案

造相-Z-Image-Turbo亚洲美女LoRA教程：LoRA模型热更新不中断服务方案 1. 引言：当AI绘画遇上风格定制想象一下，你正在运营一个AI绘画服务，用户们特别喜欢生成亚洲风格的人物肖像。你找到了一个效果惊艳的LoRA模型——laonansheng…

张开发

前端开发 2026/4/12 11:55:25

GLM-4.6V-Flash-WEB应用案例：如何用它快速搭建一个智能图文问答系统？

GLM-4.6V-Flash-WEB应用案例：如何用它快速搭建一个智能图文问答系统？ 1. 引言：为什么选择GLM-4.6V-Flash-WEB 想象这样一个场景：你正在开发一个电商客服系统，用户上传了一张商品包装图并询问"这个成分表里有没有…

张开发

前端开发 2026/4/12 11:54:18

PyTorch实战：用SE模块提升CNN模型精度的完整教程（附注意力热图可视化代码）

PyTorch实战：用SE模块提升CNN模型精度的完整教程（附注意力热图可视化代码） 在计算机视觉任务中，让模型学会"看哪里"往往比简单地增加网络深度更有效。想象一下人类观察图片时的行为——我们不会均匀地关注图像的每个部分…

张开发

前端开发 2026/4/12 11:52:29

UndertaleModTool完全指南：从游戏修改到自定义创作的3步入门

UndertaleModTool完全指南：从游戏修改到自定义创作的3步入门【免费下载链接】UndertaleModTool The most complete tool for modding, decompiling and unpacking Undertale (and other GameMaker games!) 项目地址: https://gitcode.com/gh_mirrors/un/Undertal…

张开发

Qwen3跨平台GUI开发：基于Qt框架打造桌面级字幕对齐工具

最新文章

企业数据资产化全栈实战：从“入表会计”到“价值运营”的顶层架构设计（PPT）

GME-Qwen2-VL-2B-Instruct赋能微信小程序：拍照识物与智能对话实战

TCAD工艺仿真效率提升指南：Athena与Atlas网格划分的5个关键差异点解析

BiliTools终极指南：跨平台B站视频下载工具全面解析与实战教程

DIY一个USB电流计：基于STM32F103C8T6和INA226的硬件调试神器（附完整代码）

Qwen3-ASR-0.6B多模态应用：结合视觉的智能语音识别系统

推荐文章

在Windows系统安装Docker

HagiCode Desktop 混合分发架构解析：如何用 PP 加速大文件下载籽

TensorRT安装避坑指南：解决‘cuda_runtime_api.h not found’等常见错误

WindowsCleaner终极指南：3步解决C盘爆红，让Windows系统重获新生

告别TF卡！手把手教你给ROCK5B的SPI Nor Flash刷入NVMe启动引导（附固件包）

鱿鱼视频小说网站模板源码：快速搭建双模式资源站，轻松开启运营之路

相关文章

钢坯火焰清理机设计【开题报告+任务书+毕业论文+CAD图纸+翻译】

15 | Claude Code Hooks 事件驱动自动化：防微杜渐的安全防线

Linux党福利：Debian12下用VSCode+SDCC玩转51单片机（含WSL配置指南）

从微调到精控：可变电阻在音频电路中的深度应用解析

Mahony、互补滤波与卡尔曼：给嵌入式新手的六轴姿态融合算法选型指南

保姆级教程：在WSL2的Ubuntu 22.04上，用CUDA 12.9编译运行llama.cpp（含模型下载避坑指南）

分享文章

更多文章

实战指南：5个技巧高效使用计算机视觉特征匹配基准数据集

写算法香水试香卡镂空导流更入味，输出:美妆店/专柜小物料。

Cesium进阶实战：粒子系统动态属性交互控制面板开发

Lychee模型在遥感图像分析中的创新应用

Pixel Epic · Wisdom Terminal 代码助手深度体验：对比Claude Code与本地化部署优势

VS Code 自定义字体全攻略：从安装到优化

保姆级教程：用WebRTC-streamer在5分钟内搭建RTSP摄像头监控系统（含Docker配置）

Transformer原理详解与LiuJuan20260223Zimage模型调优实践

造相-Z-Image-Turbo亚洲美女LoRA教程：LoRA模型热更新不中断服务方案

GLM-4.6V-Flash-WEB应用案例：如何用它快速搭建一个智能图文问答系统？

PyTorch实战：用SE模块提升CNN模型精度的完整教程（附注意力热图可视化代码）

UndertaleModTool完全指南：从游戏修改到自定义创作的3步入门