宇宙ebike实习产出

3684 字

10 分钟

宇宙ebike实习产出

2026-02-15

AI 实战

Vibe

/

Stable Diffusion

/

工程思维

/

小红书

/

LoRA

既有经验 + AI = 竞争力

📐 板块一：Stable Diffusion & LoRA#

☁️ 新时代的设计：从 0 到 0.8 的跃迁#

现在做设计，已经不需要从 0 到 1 凡事亲力亲为了。0 到 0.8 的活儿 AI 都能帮你搞定，剩下的 0.2 才是设计师施展审美、精雕细琢的“胜负手”。这种变革省去了大量的重复劳动，设计的门槛也跟着降了下来。

甚至像我这样“学遥感”的门外汉，也能深度参与进来（虽说目前只是在帮导师做 PPT 和地理概念图）。那么，怎么才能驾驭好 AI？我觉得核心就两点：

预期控制：用指令和模型，让 AI 吐出来的画尽量贴合脑子里的构思。
本地编辑：给 AI 的“半成品”做精细化的后期处理。

AI 设计概念图

🖥️ 工具选择：Stable Diffusion 与它的生态#

折腾一圈下来，我发现像 Gemini 这种在线工具虽然方便，但风格精准度很难把控。最后还是回到了更有生命力的本地生态：Stable Diffusion (SD)。

什么是 Stable Diffusion？#

简单说，它不是在画布上涂抹，而是在“数字噪声”中提取符合你描述的形状。相比 Midjourney 的封闭，SD 的魅力在于它完全开源的插件生态。

秋叶 WebUI：设计师的操作台#

命令行对非程序员来说还是太硬了。秋叶 (Akiba) WebUI 就像是给复杂的引擎装上了一个直观的仪表盘，采样方法、提示词权重、迭代步数，点点鼠标就能调。

🧪 实测：练一个属于自己的 LoRA 模型#

为了让 AI 认出我桌上的东西，我决定练一个 LoRA (Low-Rank Adaptation) 模型。它就像是大模型的一个“轻量补丁”，能让模型瞬间学会某个特定的角色或画风。

克隆对象：陪我办公的 萨拉赫 (Mohamed Salah) 积木小人。
数据集准备：
- 实物摄影：为了让模型能“全方位无死角”地认出这个积木人，我用 iPhone 16 Pro 拍摄了约 50 张 涵盖俯视、侧视、仰视以及特写角度的实操图。
- 逻辑关联：在打标签（Captioning）时，触发词设为 salah toy。
- 实测痛点：因为积木本身的质感跟“真人”有次元差，如何平衡这种反差成了训练的关键。

萨拉赫原始主角训练集准备过程

🖼️ 实验进阶：多模型对比与“提示词博弈”#

在有了 LoRA 这个“专属外挂”后，我尝试了不同底模和提示词组合，发现了一些非常有意思的逻辑细节：

1. 默认模型 vs 高级模型#

起初我直接用了 SD 1.5 的默认底核，出图质感中规中矩，只能算是“画得像”。随后我从 C 站下载了更高级的 Realistic 和 JuggernautXL 写实类模型进行实验。

SD 1.5 默认底模 (中规中矩)

SD 1.5 默认输出

高级写实模型 (光影/质感飞跃)

Realistic 模型输出

对比发现：高级模型对光影映射（如金属积木的反光）处理得远比默认模型细腻，质感得到了飞跃式的提升。

2. “幼年萨拉赫”之谜：提示词的权重博弈#

在实验过程中出现了一个有趣的插曲：由于我在提示词里加入了 toy（为了触发我的 LoRA 特征），AI 居然固执地生成了一个“幼年版”萨拉赫，这大概是因为 AI 的逻辑里，“玩具”往往和“童年”是强关联的。

意外结局：没设置反向提示词前，萨拉赫看起来只有 10 岁。
纠偏方案：通过在 Negative Prompt (反向提示词) 明确排除 child, kid, young 后，终于得到了那个英气飒爽的利物浦核心。

反向提示词设置前

设置后（锁定年龄段）

设置后效果

3. 场景拓展与后期微调#

我还尝试把萨拉赫丢到了各种离谱的场景里，比如漫天大雪的极地。同时，为了修正一些细节偏差（如积木边缘的毛刺），我配合使用了 img2img (图生图) 进行局部重绘。

LoRA 权重触发测试

LoRA 触发效果

img2img 局部重绘后期

图生图后期处理

极地雪景实验

📊 总结复盘：数据和逻辑的博弈#

我对比了动漫风 (JANKU) 和写实风 (JuggernautXL) 模型后发现：

风格覆盖：只要加上 LoRA，动漫模型也能准确画出萨拉赫的脸。
结论：大模型的通识能力极强，LoRA 的作用是引导和具象化，把特定的特征和通用概念结合起来。

萨拉赫_二次元雪地实验

📝 阶段总结&&未来计划#

前期训练集准备是至关重要的，决定了最后输出模型的基本质量。其中LoRA模型训练时的提示词一定要小心设置，尽量设计成没有实际意义的，比如说将提示词设计为salah，其大模型里很有可能已经学习了萨拉赫的有关先验知识，这就让LoRA模型的实际作用很难评估。未来我计划继续探索不同模型和参数的组合，尝试训练更多不同类型的LoRA模型，并探索如何将AI生成的内容与实际工作流更紧密地结合起来。设计出能应用于e-bike上的一套完整自动化工作流。

🚀 板块二：AI 文本排版#

🔧 实战思考：AI Native 的工作流#

这部分记录了我对 AI Native 的深度思考：别只把 AI 当成“高级搜索引擎”，要把它真正嵌入到工作流里。

核心能力：最后拼的是工程思维#

拆解问题：给出系统化的处理方案，而不仅仅是问一句答一句。
闭环输出：生成的目的是为了完成，而非仅仅是产生内容。

实战成果1：文章转幻灯片#

为了让思考更直观，我手搓了一个 Agent Skill: xhs-article-slides。

它能自动拆解长文逻辑，生成 3:4 比例的极简风幻灯片（也可以选宇宙科幻风）。这种形式更适合移动端的沉浸式阅读，也更对 Z 世代碎片化阅读的胃口。以下是一些具体案例：

🔧 最后拼的是工程思维。（内容来源：小红书博主不好惹的娃娃脸 Guxi）
项目：宇宙电动公众号内容“视频化”活化 （利用 html-ppt-skill 实现的多风格一键转化。）
- 🚀 宇宙电动：悬崖边的三年。（科幻版）
- 📈 宇宙电动：品牌发展全史。（全量版）
- 🎯 宇宙电动：VAPOR 产品路演。（商务版）
- 📱 宇宙电动：小红书内容复用示例。（适配移动端）

NOTE
关于 html-ppt-skill (by lewislulu)：这是我在项目中引入的一款非常硬核的开源工具，可以极大地提升内容转化的效率。

基本功能：支持将 Markdown 或 HTML 内容一键导出为具备高度交互性的幻灯片，内置多种专业皮肤。

快捷操作：通过键盘⬅️ ➡️播放页面，生成的页面支持 Space / Enter 下一页，N 键切换演讲者模式，以及 F 键全屏。

💼 板块三：工作任务#

📊 宇宙电动：官方号内容升级建议
- S (Situation)：老板个人 IP 积累了大量优质原生内容，但官方账号内容建设相对滞后，缺乏品牌调性支撑。
- T (Task)：评估个人账号历史内容的“官号化”迁移价值，制定差异化内容策略。
- A (Action)：对 100+ 条历史视频进行深度标签化拆解，分析用户互动分布，提取核心爆款逻辑。
- R (Result)：输出了系统的品牌内容升级方案，助力官方号在保持品牌感的同时实现了流量的稳定增长。
🎨 宇宙电动：Figma × AI 小红书排版与内容设计作品集
- S (Situation)：小红书日常宣发中，如何高效高质地将视觉元素与文案排版融合成爆款图文是一大痛点。
- T (Task)：利用 Figma 对接 AI 生成的素材和文本，快速产出结构清晰、层级分明且契合品牌调性的小红书封面和内页正文卡片。
- A (Action)：在 Figma 中规范搭建了包括“极简白底彩虹条 (VaporSL)”、“情绪痛点 Auto-Layout”和“越野技术大字报”在内的多种视觉版式，并与 GPT 图像/文案模型、Gemini 1.5 Pro/Nano 及豆包等进行排版协作与测试。
- R (Result)：构建了一套高度契合小红书双列 Feed 流特性的极简网格排版系统，支持在浏览器中直接点击打开作品集，展示具体的排版设计稿。

[🤖 宇宙电动：小红书一站式内容生成工作流 AI Agent Skill]

S (Situation)：小红书运营中急需一套全流程的生成方案，涵盖从封面构思、标题拟定、正文撰写到图片布局。
T (Task)：融合优秀小红书运营手册的心法，统计分析账号发表数据并运用 OCR 技术标注爆款典型案例，开发出整合“封面、标题、文案、tag 及图片排版”的一站式生成工作流。
A (Action)：
1. 数据建库与本土化：运用 OCR 技术文字化简述历史封面，人工标注典型案例，将运营课心法进行本土化转化。
2. 全流程工作流封装：用代码封装工作流，以“群众画像 + 已有素材 + 运营目标”为输入，一键比对并产出高点击的封面范式、花字、15-20字标题、呼吸感分段正文及 tag，并输出相匹配的图片排版规范建议。
R (Result)：实现了运营需求与已有素材的双向对接，不仅输出满意的封标，还包含正文排版和标签，极大提升了内容在小红书双列 Feed 流中的生产与宣发效率。

1
// 🤖 小红书一站式内容生成工作流核心接口定义
2
interface XHSContentWorkflowGenerator {
3
  input: {
4
    audiencePortrait: string[];   // 群众画像 (如: 城市白领, 公路车新手)
5
    rawMaterial: string;          // 骑行日记/新车参数/评测等已有素材
6
    marketingGoal: "种草" | "咨询" | "品牌曝光"; // 目标定位
7
  };
8

9
  process: {
10
    // 利用 OCR 提取并分析历史封面版式与文案，结合典型案例库进行匹配
11
    analyseHistoryData: (ocrText: string, category: string) => TargetTemplate;
12
    // 融入王梦珂 2026 最新品牌派心法，进行公司化模型调优
13
    applyBrandMethodology: (input: string) => OptimizedCorePrompt;
14
  };
15

16
  output: {
17
    coverDesign: {
18
      paradigm: "留白排版型" | "大字报型" | "泥石流型" | "经典图文"; // 9种封面成熟范式
19
      visualAnchor: string;    // 固定识别符号/视觉锚点建议
20
      flowerText: string;      // 封面花字 (网感/调皮/悬念句式)
21
    };
22
    titleOptions: string[];    // 5-10个正式标题 (控制在15-20字, 融入地标/功效关键词)
23
    bodyContent: {
24
      text: string;            // 呼吸感分段的正文文案
25
      tags: string[];          // 精准推荐的话题标签 (如 #Ebike)
26
    };
27
    layoutGuide: string;       // 图片多图拼贴或切片排版规范建议
28
  }
29
}

🛠️ 宇宙电动：用户反馈统计工具 (U&I Ops Intelligence)
- S (Situation)：售后与销售过程中的用户真实反馈（Leads）分布在各种聊天记录中，难以形成系统性洞察。
- T (Task)：开发一套具备云端同步能力的实时反馈统计看板，支持多维度趋势分析。
- A (Action)：利用 Supabase 建立后端数据库，前端实现实时数据流更新、动态图表展示及多表关联筛选。
- R (Result)：实现了用户痛点的分钟级响应，为产品快速迭代提供了最前线的真实数据闭环。
🚲 宇宙电动：校园单车与电助力车调研录入系统
- S (Situation)：进行电助力车（ebike）产品定位时，需要收集和分析青年群体在高校等封闭场景下的真实用车习惯、品牌偏好及电助力渗透现状。
- T (Task)：设计并实现一个高可用、轻量化的移动端数据录入与分析工具，方便调研人员在实地快速记录样本并实现实时大盘可视化。
- A (Action)：基于 Vue 3、Tailwind CSS 及 Chart.js 构建了单页面应用，包含录入面板、大盘图表以及电助力深度洞察库，支持 LocalStorage 本地存储与 SheetJS 导出 Excel 报表。
- R (Result)：在实地调研中快速标记多组有效样本，成功帮助团队提取出低端电助力改装车的核心痛点与特征，为后续 ebike 品牌升级奠定了实证基础。
📱 宇宙电动：Planet Between 极客骑行小程序与 AR 互动原型
- S (Situation)：市面上多数骑行 App 偏向传统数据记录，缺乏与 E-Bike 硬件的深度互动，且视觉风格传统，难以形成差异化极客社群体验。
- T (Task)：为品牌策划并搭建了一套高科技感的数字化应用概念方案，涵盖 VAPOR 全息仪表盘、Pro HUD 竞技座舱以及基于 LBS 的 AR 能量舱（彩蛋）路书社交系统。
- A (Action)：使用 Uni-app (Vue3 + Vite) 框架，设计 Custom Glassmorphism 拟态玻璃视觉系统，编写 LBS 战术雷达引擎、WebCamera 模拟器组件，并实现了离线路书与 360° 全景传送等多类数字能量舱彩蛋交互。
- R (Result)：构建了具备强烈赛博科幻感的高交互小程序原型，高度契合品牌硬核极客调性，为品牌后续发力骑行数字化社群运营奠定了扎实的设计底座。
🔍 宇宙电动：骑行 App 竞品分析与数字化定位
- S (Situation)：市面上现有骑行 App（如黑鸟单车、际刻骑行）多为纯记录工具，缺乏与硬件的深度耦合；而传统车企（如捷安特）专属 App 工业感过重，不契合 E-Bike 年轻极客群体的科技与情感需求。
- T (Task)：对骑行 App 市场和重点竞品进行多维度解构，寻找品牌数字化突围路径，为 Planet Between 探索硬核、有趣的差异化产品定位。
- A (Action)：分析黑鸟单车、捷安特等 5+ 款主流与传统骑行软件的交互模式与视觉局限性，提炼出以 “Cyber-Noir 硬核” 与 “AR 能量舱社交” 为主导的数字化体验方案。
- R (Result)：明确了“不仅是工具，更是品牌交互中枢与极客社群”的数字生态定位，直接推演并输出了 Planet Between 智慧骑行小程序的交互原型。

宇宙ebike实习产出

https://www.bettercall12.cc/posts/ai设计学习笔记/

作者

十二

发布于

2026-02-15

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

张咋啦 AI 学习笔记：从基础理念到全自动工作流

维护中

既有经验 + AI = 竞争力

📐 板块一：Stable Diffusion & LoRA#

☁️ 新时代的设计：从 0 到 0.8 的跃迁#

🖥️ 工具选择：Stable Diffusion 与它的生态#

什么是 Stable Diffusion？#

秋叶 WebUI：设计师的操作台#

🧪 实测：练一个属于自己的 LoRA 模型#

🖼️ 实验进阶：多模型对比与“提示词博弈”#

1. 默认模型 vs 高级模型#

2. “幼年萨拉赫”之谜：提示词的权重博弈#

3. 场景拓展与后期微调#

📊 总结复盘：数据和逻辑的博弈#

📝 阶段总结&&未来计划#

🚀 板块二：AI 文本排版#

🔧 实战思考：AI Native 的工作流#

核心能力：最后拼的是工程思维#

实战成果1：文章转幻灯片#

💼 板块三：工作任务#