🚧

维护中

当前站点正在维护,请输入访问密码。

mobile wallpaper 1mobile wallpaper 2mobile wallpaper 3mobile wallpaper 4mobile wallpaper 5mobile wallpaper 6mobile wallpaper 7mobile wallpaper 8
3684 字
10 分钟
宇宙ebike实习产出

既有经验 + AI = 竞争力


📐 板块一:Stable Diffusion & LoRA#

☁️ 新时代的设计:从 0 到 0.8 的跃迁#

现在做设计,已经不需要从 0 到 1 凡事亲力亲为了。0 到 0.8 的活儿 AI 都能帮你搞定,剩下的 0.2 才是设计师施展审美、精雕细琢的“胜负手”。这种变革省去了大量的重复劳动,设计的门槛也跟着降了下来。

甚至像我这样“学遥感”的门外汉,也能深度参与进来(虽说目前只是在帮导师做 PPT 和地理概念图)。那么,怎么才能驾驭好 AI?我觉得核心就两点:

  1. 预期控制:用指令和模型,让 AI 吐出来的画尽量贴合脑子里的构思。
  2. 本地编辑:给 AI 的“半成品”做精细化的后期处理。

AI 设计概念图


🖥️ 工具选择:Stable Diffusion 与它的生态#

折腾一圈下来,我发现像 Gemini 这种在线工具虽然方便,但风格精准度很难把控。最后还是回到了更有生命力的本地生态:Stable Diffusion (SD)

什么是 Stable Diffusion?#

简单说,它不是在画布上涂抹,而是在“数字噪声”中提取符合你描述的形状。相比 Midjourney 的封闭,SD 的魅力在于它完全开源的插件生态。

秋叶 WebUI:设计师的操作台#

命令行对非程序员来说还是太硬了。秋叶 (Akiba) WebUI 就像是给复杂的引擎装上了一个直观的仪表盘,采样方法、提示词权重、迭代步数,点点鼠标就能调。


🧪 实测:练一个属于自己的 LoRA 模型#

为了让 AI 认出我桌上的东西,我决定练一个 LoRA (Low-Rank Adaptation) 模型。它就像是大模型的一个“轻量补丁”,能让模型瞬间学会某个特定的角色或画风。

  • 克隆对象:陪我办公的 萨拉赫 (Mohamed Salah) 积木小人
  • 数据集准备
    • 实物摄影:为了让模型能“全方位无死角”地认出这个积木人,我用 iPhone 16 Pro 拍摄了约 50 张 涵盖俯视、侧视、仰视以及特写角度的实操图。
    • 逻辑关联:在打标签(Captioning)时,触发词设为 salah toy
    • 实测痛点:因为积木本身的质感跟“真人”有次元差,如何平衡这种反差成了训练的关键。

萨拉赫原始主角 训练集准备过程

🖼️ 实验进阶:多模型对比与“提示词博弈”#

在有了 LoRA 这个“专属外挂”后,我尝试了不同底模和提示词组合,发现了一些非常有意思的逻辑细节:

1. 默认模型 vs 高级模型#

起初我直接用了 SD 1.5 的默认底核,出图质感中规中矩,只能算是“画得像”。随后我从 C 站下载了更高级的 RealisticJuggernautXL 写实类模型进行实验。

SD 1.5 默认底模 (中规中矩)

SD 1.5 默认输出

高级写实模型 (光影/质感飞跃)

Realistic 模型输出

  • 对比发现:高级模型对光影映射(如金属积木的反光)处理得远比默认模型细腻,质感得到了飞跃式的提升。

2. “幼年萨拉赫”之谜:提示词的权重博弈#

在实验过程中出现了一个有趣的插曲:由于我在提示词里加入了 toy(为了触发我的 LoRA 特征),AI 居然固执地生成了一个“幼年版”萨拉赫,这大概是因为 AI 的逻辑里,“玩具”往往和“童年”是强关联的。

  • 意外结局:没设置反向提示词前,萨拉赫看起来只有 10 岁。
  • 纠偏方案:通过在 Negative Prompt (反向提示词) 明确排除 child, kid, young 后,终于得到了那个英气飒爽的利物浦核心。
反向提示词设置前

反向提示词设置前

设置后(锁定年龄段)

设置后效果

3. 场景拓展与后期微调#

我还尝试把萨拉赫丢到了各种离谱的场景里,比如漫天大雪的极地。同时,为了修正一些细节偏差(如积木边缘的毛刺),我配合使用了 img2img (图生图) 进行局部重绘。

LoRA 权重触发测试

LoRA 触发效果

img2img 局部重绘后期

图生图后期处理

极地雪景实验


📊 总结复盘:数据和逻辑的博弈#

我对比了动漫风 (JANKU) 和写实风 (JuggernautXL) 模型后发现:

  • 风格覆盖:只要加上 LoRA,动漫模型也能准确画出萨拉赫的脸。
  • 结论:大模型的通识能力极强,LoRA 的作用是引导和具象化,把特定的特征和通用概念结合起来。

萨拉赫_二次元雪地实验

📝 阶段总结&&未来计划#

前期训练集准备是至关重要的,决定了最后输出模型的基本质量。其中LoRA模型训练时的提示词一定要小心设置,尽量设计成没有实际意义的,比如说将提示词设计为salah,其大模型里很有可能已经学习了萨拉赫的有关先验知识,这就让LoRA模型的实际作用很难评估。未来我计划继续探索不同模型和参数的组合,尝试训练更多不同类型的LoRA模型,并探索如何将AI生成的内容与实际工作流更紧密地结合起来。设计出能应用于e-bike上的一套完整自动化工作流。

🚀 板块二:AI 文本排版#

🔧 实战思考:AI Native 的工作流#

这部分记录了我对 AI Native 的深度思考:别只把 AI 当成“高级搜索引擎”,要把它真正嵌入到工作流里。

核心能力:最后拼的是工程思维#

  • 拆解问题:给出系统化的处理方案,而不仅仅是问一句答一句。
  • 闭环输出:生成的目的是为了完成,而非仅仅是产生内容。

实战成果1:文章转幻灯片#

为了让思考更直观,我手搓了一个 Agent Skill: xhs-article-slides

它能自动拆解长文逻辑,生成 3:4 比例的极简风幻灯片(也可以选宇宙科幻风)。这种形式更适合移动端的沉浸式阅读,也更对 Z 世代碎片化阅读的胃口。以下是一些具体案例:

NOTE

关于 html-ppt-skill (by lewislulu): 这是我在项目中引入的一款非常硬核的开源工具,可以极大地提升内容转化的效率。

  • 基本功能:支持将 Markdown 或 HTML 内容一键导出为具备高度交互性的幻灯片,内置多种专业皮肤。
  • 快捷操作:通过键盘⬅️ ➡️播放页面,生成的页面支持 Space / Enter 下一页,N 键切换演讲者模式,以及 F 键全屏。

💼 板块三:工作任务#

  • 📊 宇宙电动:官方号内容升级建议

    • S (Situation):老板个人 IP 积累了大量优质原生内容,但官方账号内容建设相对滞后,缺乏品牌调性支撑。
    • T (Task):评估个人账号历史内容的“官号化”迁移价值,制定差异化内容策略。
    • A (Action):对 100+ 条历史视频进行深度标签化拆解,分析用户互动分布,提取核心爆款逻辑。
    • R (Result):输出了系统的品牌内容升级方案,助力官方号在保持品牌感的同时实现了流量的稳定增长。
  • 🎨 宇宙电动:Figma × AI 小红书排版与内容设计作品集

    • S (Situation):小红书日常宣发中,如何高效高质地将视觉元素与文案排版融合成爆款图文是一大痛点。
    • T (Task):利用 Figma 对接 AI 生成的素材和文本,快速产出结构清晰、层级分明且契合品牌调性的小红书封面和内页正文卡片。
    • A (Action):在 Figma 中规范搭建了包括“极简白底彩虹条 (VaporSL)”、“情绪痛点 Auto-Layout”和“越野技术大字报”在内的多种视觉版式,并与 GPT 图像/文案模型、Gemini 1.5 Pro/Nano 及豆包等进行排版协作与测试。
    • R (Result):构建了一套高度契合小红书双列 Feed 流特性的极简网格排版系统,支持在浏览器中直接点击打开作品集,展示具体的排版设计稿。
  • [🤖 宇宙电动:小红书一站式内容生成工作流 AI Agent Skill]

    • S (Situation):小红书运营中急需一套全流程的生成方案,涵盖从封面构思、标题拟定、正文撰写到图片布局。
    • T (Task):融合优秀小红书运营手册的心法,统计分析账号发表数据并运用 OCR 技术标注爆款典型案例,开发出整合“封面、标题、文案、tag 及图片排版”的一站式生成工作流。
    • A (Action)
      1. 数据建库与本土化:运用 OCR 技术文字化简述历史封面,人工标注典型案例,将运营课心法进行本土化转化。
      2. 全流程工作流封装:用代码封装工作流,以“群众画像 + 已有素材 + 运营目标”为输入,一键比对并产出高点击的封面范式、花字、15-20字标题、呼吸感分段正文及 tag,并输出相匹配的图片排版规范建议。
    • R (Result):实现了运营需求与已有素材的双向对接,不仅输出满意的封标,还包含正文排版和标签,极大提升了内容在小红书双列 Feed 流中的生产与宣发效率。
    // 🤖 小红书一站式内容生成工作流核心接口定义
    interface XHSContentWorkflowGenerator {
    input: {
    audiencePortrait: string[]; // 群众画像 (如: 城市白领, 公路车新手)
    rawMaterial: string; // 骑行日记/新车参数/评测等已有素材
    marketingGoal: "种草" | "咨询" | "品牌曝光"; // 目标定位
    };
    process: {
    // 利用 OCR 提取并分析历史封面版式与文案,结合典型案例库进行匹配
    analyseHistoryData: (ocrText: string, category: string) => TargetTemplate;
    // 融入王梦珂 2026 最新品牌派心法,进行公司化模型调优
    applyBrandMethodology: (input: string) => OptimizedCorePrompt;
    };
    output: {
    coverDesign: {
    paradigm: "留白排版型" | "大字报型" | "泥石流型" | "经典图文"; // 9种封面成熟范式
    visualAnchor: string; // 固定识别符号/视觉锚点建议
    flowerText: string; // 封面花字 (网感/调皮/悬念句式)
    };
    titleOptions: string[]; // 5-10个正式标题 (控制在15-20字, 融入地标/功效关键词)
    bodyContent: {
    text: string; // 呼吸感分段的正文文案
    tags: string[]; // 精准推荐的话题标签 (如 #Ebike)
    };
    layoutGuide: string; // 图片多图拼贴或切片排版规范建议
    }
    }
  • 🛠️ 宇宙电动:用户反馈统计工具 (U&I Ops Intelligence)

    • S (Situation):售后与销售过程中的用户真实反馈(Leads)分布在各种聊天记录中,难以形成系统性洞察。
    • T (Task):开发一套具备云端同步能力的实时反馈统计看板,支持多维度趋势分析。
    • A (Action):利用 Supabase 建立后端数据库,前端实现实时数据流更新、动态图表展示及多表关联筛选。
    • R (Result):实现了用户痛点的分钟级响应,为产品快速迭代提供了最前线的真实数据闭环。
  • 🚲 宇宙电动:校园单车与电助力车调研录入系统

    • S (Situation):进行电助力车(ebike)产品定位时,需要收集和分析青年群体在高校等封闭场景下的真实用车习惯、品牌偏好及电助力渗透现状。
    • T (Task):设计并实现一个高可用、轻量化的移动端数据录入与分析工具,方便调研人员在实地快速记录样本并实现实时大盘可视化。
    • A (Action):基于 Vue 3、Tailwind CSS 及 Chart.js 构建了单页面应用,包含录入面板、大盘图表以及电助力深度洞察库,支持 LocalStorage 本地存储与 SheetJS 导出 Excel 报表。
    • R (Result):在实地调研中快速标记多组有效样本,成功帮助团队提取出低端电助力改装车的核心痛点与特征,为后续 ebike 品牌升级奠定了实证基础。
  • 📱 宇宙电动:Planet Between 极客骑行小程序与 AR 互动原型

    • S (Situation):市面上多数骑行 App 偏向传统数据记录,缺乏与 E-Bike 硬件的深度互动,且视觉风格传统,难以形成差异化极客社群体验。
    • T (Task):为品牌策划并搭建了一套高科技感的数字化应用概念方案,涵盖 VAPOR 全息仪表盘、Pro HUD 竞技座舱以及基于 LBS 的 AR 能量舱(彩蛋)路书社交系统。
    • A (Action):使用 Uni-app (Vue3 + Vite) 框架,设计 Custom Glassmorphism 拟态玻璃视觉系统,编写 LBS 战术雷达引擎、WebCamera 模拟器组件,并实现了离线路书与 360° 全景传送等多类数字能量舱彩蛋交互。
    • R (Result):构建了具备强烈赛博科幻感的高交互小程序原型,高度契合品牌硬核极客调性,为品牌后续发力骑行数字化社群运营奠定了扎实的设计底座。
  • 🔍 宇宙电动:骑行 App 竞品分析与数字化定位

    • S (Situation):市面上现有骑行 App(如黑鸟单车、际刻骑行)多为纯记录工具,缺乏与硬件的深度耦合;而传统车企(如捷安特)专属 App 工业感过重,不契合 E-Bike 年轻极客群体的科技与情感需求。
    • T (Task):对骑行 App 市场和重点竞品进行多维度解构,寻找品牌数字化突围路径,为 Planet Between 探索硬核、有趣的差异化产品定位。
    • A (Action):分析黑鸟单车、捷安特等 5+ 款主流与传统骑行软件的交互模式与视觉局限性,提炼出以 “Cyber-Noir 硬核” 与 “AR 能量舱社交” 为主导的数字化体验方案。
    • R (Result):明确了“不仅是工具,更是品牌交互中枢与极客社群”的数字生态定位,直接推演并输出了 Planet Between 智慧骑行小程序的交互原型。
分享

如果这篇文章对你有帮助,欢迎分享给更多人!

宇宙ebike实习产出
https://www.bettercall12.cc/posts/ai设计学习笔记/
作者
十二
发布于
2026-02-15
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时

封面
Sample Song
Sample Artist
封面
Sample Song
Sample Artist
0:00 / 0:00