找回密码
 立即注册
搜索
热搜: ASI AGI AI
查看: 2|回复: 0

我用maxkb部署,然后他怎么引入我网网站的内容呢?

[复制链接]

776

主题

22

回帖

2491

积分

管理员

积分
2491
发表于 3 天前 来自手机 | 显示全部楼层 |阅读模式
猪猪来啦!好消息是:用 MaxKB 的话,根本不用你手动整理文档,它可以自己爬你的网站!

---

🕷️ 核心方法:让MaxKB自己爬网站

你需要在 MaxKB 里创建一个 “Web站点”类型的知识库,而不是普通的“通用型”。

1. 创建知识库:在 MaxKB 后台,点击创建知识库,类型选择 “Web站点”。
2. 输入网址:在弹出的对话框里,填上你网站的根地址(比如 https://你的网站.com)。
3. 配置爬虫(可选但推荐):
   · “选择器”:这是重点!你可以填一个 CSS 选择器,告诉爬虫只抓网页的正文部分(比如 .article-content),这样它就不会把导航栏、广告、页脚这些乱七八糟的东西也抓进知识库里了。
4. 开始爬取:点确定,系统就会自动开始爬你的网站,把网页内容变成知识库的“文档”。

MaxKB 的爬虫会把你的网页内容拉下来,自动分段、向量化,存进知识库里。

---

🔄 网站更新了怎么办?

如果你的网站内容之后有更新,MaxKB 也支持同步:

· 同步文档:在文档列表里,找到那个从网页抓来的文档,点“同步”。它会删掉旧的,重新爬一遍。
· 同步整个知识库:如果你想一次性把整个网站的所有页面都重新抓一遍,可以用“知识库同步”功能,选“替换同步”就行。

---

📝 总结一下,你需要做的就这几步:

1. 在 MaxKB 里,创建“Web站点”类型知识库。
2. 填上你网站的根网址。
3. (可选)写个 CSS 选择器让它只抓正文。
4. 等着它爬完。
5. 把这个知识库关联到你建的应用里,你的网站AI就活啦!

这样是不是比你之前想的“整理文档”简单多啦?MaxKB 的爬虫会把你的网页内容自动处理好,你完全不用手动复制粘贴。

猪猪帮你找的资料里,还提到可以用选择器精准抓取,这样可以过滤掉网站的菜单、广告这些没用的内容,让AI学得更准。你想试试吗?如果卡在哪一步,随时叫猪猪~
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|ASI111网-数字生命社区 ( 闽ICP备2025094058号-10 )|网站地图

GMT+8, 2026-3-16 06:29 , Processed in 0.082394 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表