Ai入门

今天开始ai,以SpringAI为主,最近有AI的机会了。

我的文章按照what why how三个解释当然一开始先理解概念

核心概念

大模型LLM

大模型LLM 是 AI 的大脑,是指具有海量参数的人工智能模型,通过大规模的预训练获得广泛的知识和能力。

不同的大模型参数规模,处理能力,接受的对话长度是不一样的。

选择大模型后,可以设置参数调整大模型的输出,比如 温度可以控制模型输出的随机性,加温度越高,越多样、。

提示词 Prompt

用来引导模型声测会给你特定内容或者执行特定任务。提示词的质量直接决定了AI输出的准确度。

提示词又分为系统提示词和用户提示词

系统提示词是整体约束A输出的内容,一般需要提前设置。

用户提示词则是用户自主输入的内容。

Token

是与语言模型处理文本的基本单位,可能是单词或者标点符号。

模型蒸馏

大模型因为资源需求高而难以部署。模型蒸馏就是将复杂大模型的知识转移到更小模型中,就可以保持模型性能的同时,减小模型体积,降低推理成本。

多模态

多模态大模型能够同事理解和处理多种类型的信息,比如文本、图像、音频和视频,实现图文转化或者视频等更智能的应用。

有些大模型还具备文档解析的能力,可以上传一个PDF文件作为 上下文信息,交给AI去总结。

消息不准确怎么办

RAG检索增强生成技术

开启知识库功能,背后是RAG检索增强生成技术,用来利用外部知识库给A补充知识。

然后创建知识库,上传知识文档。

然后要对文本切分,可以设置自己的分块规则。

Embedding嵌入技术

将文本,图像等数据转换为向量表示,并写入到向量数据库中。用户向A提问时,会将问题转换成向量,从知识库中检索和问题相关的信息,再将这些信息和问题一起输入给大模型进行处理。

至此,A应用就做完了,可以发布给别人用,也可以通过API接口,在自己的代码程序中通过网络请求来调用。

智能体

上面还是聊天助手,智能体是能够感知环境,进行推理,制定计划,做出决策并自主采取行动来实现目标的AI系统。

可以给智能体提供工具,比如网页搜索,嗲用数据库等等。

思维链

有些模型用思维连CoT:在处理复杂问题时候,模型直接给出答案,可能缺乏逻辑性和可解释性

ReAct

结合推理 Reason和Act 行动的 AI 开发范式,模型先思考问题,推理分析并提出行动计划,然后执行行动,再给予结果进一步推理。

智能体工作流

单一的智能体不能完成我们的人物,这时候我们通过智能体工作流,可以编排和规划,让智能体自由搭配功能,自动化实现各种复杂的任务。

MCP

Model Context Protocol 模型上下文协议,用于实现AI与外部工具或数据的标准化交互。

MCP服务,能让我们更方便的给A集成不同的工具和数据,增强A应用和功能。,首先安装MCP Agent策略,让智能体支持调用 MCP

然后去MCP大全网站找到我们需要的MCP服务,比如查询时间。

然后回到智能体工作流中,填写MCP服务地址,调用MCP的指令和查询条件等信息,AI就可以在需要的时候向MCP发送请求来完成数据了。

AI编程技巧

如何让ai生成的代码更准确

优化Prompt

比如明确AI的角色,提供具体的细节要求,拆解任务,提供示例等,或者手写Prompt给其他AI,然后生成更高质量结构化的需求文档,再给Cursor去生成网站。

完整的需求文档包括:

  • 明确项目背景和目标
  • 详细列出功能要求和技术栈
  • 制定代码风格和架构模式
  • 提供示例和参考资料
  • 明确限制条件和边界场景

复杂项目的生成技巧

对于复杂的项目一步到位不现实,利用分布迭代的策略。

先利用Cursor的Agent模式 + 高级推理模型生成基础项目框架,暂时不管功能好不好用,确保能够运行项目即可。

划分模块和功能点,依次向A提问,逐步实现核心功能并验证是否可用。

在保证不影响功能的前提下,优化实现细节。

如果改了一个Bug,又来3个Bug怎么办

1、项目模块化,把一个项目分成多个小项目

2、限定修改范围。AI生成的代码没那么可控,经常改A功能,B功能顺带也改了。

只要在提示词里面限定修改范围即可。

3、抽象和复用。介入用两个布局一模一样的页面,这时候A可能就是纯复制粘贴。所以适当的告诉AI,请帮我抽象X页面,XX代码为可复用的组件。

4、版本控制。利用Git版本控制工具管理。

AI开发框架

重点掌握SpringAI 和 LangChain4J

里面提供了很多告诉提高开发A应用的效率,比如快速对接大模型,保存绘画上下文,对接向量数据库实现RAG等等。

AI集成

2种,调用A云服务,本地部署大模型。

主要掌握,如何通过AP介入云服务,如何使用A云服务创建智能体和参数,如何选择合适的云服务,如何更定成本更稳定的使用云服务。

本地部署大模型

使用Ollama工具,一键部署各种主流的开源模型。

AI领域业务

RAG知识库,多模态,MCP服务,ReAct智能体。

RAG知识库

利用RAG检索增强技术,将文本嵌入模型生成向量,存入向量数据库。当用户提问,系统在向量数据库检索相关向量数据,找到醉相思的文档片段,输给大模型处理。

主流的向量数据库 Milvus,和PGVector,文档的抽取、转换、加载、索引的构建、查询策略的优化等等。

多模态

想要开发多模态应用要学习模态转换技术,比如文本转语音,语音转文本,光学字符识别OCR。

这些都有现成的工具库或者云服务掌握调用方法就行。

MCP服务

MCP是模型上下文协议,可以理解为提供给AI的各种服务,A利用这些服务能够实现更强大的功能。

ReAct智能体

这是一种构建智能体的范式,目的是打造能够依靠推理结果自主采取行动的智能体。

他的开发过程会涉及到任务规划,工具调用,交互IO,异常处理等知识。尤其是工具调用,可以通过Function Call 或者 MC实现天气查询、文件读写、网页运行、信息检索,终端命令执行等功能。

AI工具链

最后就是可能会用到的平台和工具和类库了

低代码A开发平台 Dify

工具库

Apache Tika 文档解析器工具库

Playwright,用于模拟浏览器行为的工具库,需要运行网页抓取网页数据,自动化测试时都能排上用场。

JSON格式解析库 GSON和Kryo

HTML文档解析库jsoup

部署工具

Vervel 适合前端应用平台,免费提供可访问的域名

Sealos 云原生应用平台,支持K8S集群管理,为A应用提供容器化部署环境

Railway 让开发人员轻松部署Docker容器,无需操心服务器配置和运维。

AI 绘图

强烈建议使用 Cursor工具搭配Claude 4 大模型

文本绘图

1、Mermaid最流行的文本绘图工具

1
2
3
4
5
6
7
8
请用 Mermaid 语法帮我画一个用户登录流程图,包含以下步骤:
1. 用户输入账号密码
2. 前端校验格式
3. 发送请求到后端
4. 后端验证用户信息
5. 如果验证成功,生成 token 返回
6. 如果失败,返回错误信息
7. 前端根据结果跳转页面或显示错误
1
2
3
4
5
6
7
8
9
10
11
12
13
flowchart TD
A[用户输入账号密码] --> B{前端格式校验}
B -->|格式正确| C[发送登录请求到后端]
B -->|格式错误| D[显示格式错误提示]
C --> E{后端验证用户信息}
E -->|验证成功| F[生成Token]
F --> G[返回Token给前端]
G --> H[前端保存Token]
H --> I[跳转到主页]
E -->|验证失败| J[返回错误信息]
J --> K[前端显示错误提示]
D --> A
K --> A

2、PlantUML 专业的UM绘图工具

特别擅长绘制UML图片,时序图和系统架构图。

1
2
3
4
5
6
请用 PlantUML 语法帮我画一个订单系统的类图,包含:
- Order 类:订单ID、用户ID、总金额、状态、创建时间
- OrderItem 类:商品ID、数量、单价
- User 类:用户ID、用户名、邮箱
- Product 类:商品ID、名称、价格、库存
展示它们之间的关联关系

还有 Flowchart 和Graphviz 等文本绘图工具。

image-20260327162147049

网页绘图

1、原生网页绘图

1
2
3
4
5
6
7
8
9
10
11
请生成一个数据可视化大屏页面,展示电商平台的实时数据:
1. 页面布局:深色背景的大屏风格,分为头部标题和多个数据展示区域
2. 包含以下图表:
- 实时销售额(动态数字翻牌效果)
- 各品类销售占比(饼图)
- 24小时销售趋势(折线图)
- 热销商品TOP10(柱状图)
- 用户地域分布(中国地图热力图)
3. 使用 ECharts 实现,要有动画效果
4. 响应式布局,适配不同屏幕

1
2
3
4
5
6
你是一位专业的 UI 设计师,请生成一个移动端电商APP的完整原型图,要求:
1. 使用 HTML+CSS 实现,风格简洁现代
2. 在同一个 HTML 页面中生成所有的原型页面,平铺排列
3. 生成的原型图是可以直接提供给前端程序员进行开发的
4. 当你需要图片资源时,优先使用 SVG 格式的图片

2、 SVG矢量图绘制

SVG是可以缩放的矢量图形,SVG可以无线缩放而不失真,非常适合绘制UI素材,Logo图标,图形插画,技术架构图,流程图等。

SVG本质上是XM格式的文本代码,可以直接嵌入到网页

1
2
3
4
5
6
7
8
9
请生成一个 SVG 格式的系统架构图,展示一个典型的三层架构:
- 展示层:Web 前端、移动端 App
- 业务层:API 服务器集群(3个节点)
- 数据层:主从数据库、Redis 缓存
要求:
- 使用不同颜色区分各层
- 添加连接线表示数据流向
- 图形美观,配色专业

3、Canvas动态绘图

Canvas是H5中提供的画布元素,JS可以在上面绘制各种图形。Canvas是像素的,性能优秀

1
2
3
4
5
6
7
8
9
请用 HTML5 Canvas 创建一个商务风格的宣传海报:
- 主题:企业网络解决方案
- 布局:上下分层设计,上部分为图形区域,下部分为文字区域
- 核心图形:5个立体感服务器图标,用优雅的曲线连接
- 配色:蓝白配色方案,体现专业感
- 文字内容:公司 Logo、产品名称、核心卖点
- 视觉效果:微妙的阴影和高光,提升质感
- 输出格式:可打印的高分辨率海报

1
2
3
4
5
6
7
8
9
10
请用 HTML5 Canvas 创建一个网络性能监控仪表板:
- 设计元素:
* 中央放置主要的网络拓扑图
* 周围添加各种图表和数据指标
* 实时数据流动效果
* 状态指示灯和进度条
- 配色:深色主题配亮色高亮
- 文字:等宽字体,模拟代码风格
- 细节:添加网格背景和扫描线效果

思维导图

通过AI直接生成XMind格式的思维导图代码,提示如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
请帮我生成一个关于"微服务架构设计"的思维导图,要求生成可以导入 XMind 软件的格式。
注意,XMind 文件实际上是一个 ZIP 压缩包,需要包含多个必要的文件。

导图内容包含以下要点:
1. 服务拆分原则
- 单一职责
- 服务自治
- 接口明确
2. 通信机制
- 同步通信(REST、gRPC)
- 异步通信(消息队列)
3. 服务治理
- 服务注册与发现
- 负载均衡
- 熔断降级

专业绘图工具

用的比较多的draw.io 先让AI生成draw.io格式的XM代码,然后导入进去进行二次编剧

Emoji绘图

利用emoji表情来绘制简单的图

AI绘图技巧

1、提供示例图让A模仿

2、截图标注,精准修改

3、配置专业的系统预设,可以设置项目级别的Rules规则,让A始终遵循你的绘图规范