零开发经验,我如何利用AI开发Chrome插件

通过AI技术,我在没有任何开发经验的情况下成功创建了一个Chrome插件,实现了浏览器内直接做笔记并同步到Obsidian的功能。本文将详细分享整个开发过程,并介绍我使用的工具和技巧。

0. 发现自己的需求

在梳理知识管理系统时,我意识到自从使用印象笔记以来,我已经习惯将文章剪辑保存,但很少去回顾或消化这些内容。随着稍后读软件的出现,我尝试了简悦、Cubox、Readwise等工具,但它们存在一些问题:

  1. 样式问题:抓取的网页内容在某些网站上样式丢失,且页面渲染效果较差;
  2. 不适合卡片笔记:划线+笔记模式适合渐进式阅读,但不适合将知识转化为自己的语言写成卡片;
  3. Obsidian联动麻烦:一些稍后读软件有将笔记同步到Obsidian的功能,但操作较为繁琐。

那么,为什么不直接在浏览器中边阅读边做笔记呢?

1. 用Google和GPT寻找解决方案

要在浏览器中实现边阅读边做笔记的功能,有多种方案可供选择:

  1. 开启多个软件分屏,如Chrome + 备忘录/Obsidian/Drafts;
  2. 使用支持分屏的浏览器,如Arc + flomo;
  3. 使用Chrome插件配合在线笔记工具,如Anything Copilot插件 + flomo。

因为我的主要笔记工具是Obsidian,我决定寻找一个现成的将笔记直接保存到Obsidian的Chrome插件。在Google搜索后,我发现大部分Obsidian插件都是将网页剪辑保存,而非符合我卡片笔记的需求。但我找到一个本地API项目,尝试了一下接口,发现正好符合我的要求。coddingtonbear/obsidian-local-rest-api

2. 使用AI编写插件代码

2.1 使用GPT-4完成0.1版本

我直接向GPT-4询问如何开发Chrome插件。它给了我插件的项目结构及各个文件的编写建议。基于它的指导,我使用VSCode创建了本地项目目录,并开始编写插件。

2.2 使用GPT和Claude的经验

联网能力

GPT可以通过提供第三方文档链接进行查询,而Claude暂时没有此功能。我通过使用r.jina.ai获取易于Claude处理的文档格式。

编程能力

Claude的代码生成错误较少,且反馈直接;而GPT-4倾向于输出完整代码,且会超出Token限制。

提供清晰范例

为了提高AI的输出准确性,我会提供官方文档、示例代码,甚至是产品原型或界面截图,帮助AI生成更精确的代码。

3. 测试和修改程序

AI写的代码大多数时候会出现bug,调试过程需要不断向AI提供详细的错误反馈,包括控制台输出、操作步骤、期望结果等信息。

4. 发布插件到Github(可选)

开发完成后,我希望分享插件,选择将其发布到Github。如果想提交到Chrome扩展商店,需要支付$5的开发者注册费用,推荐使用野卡轻松支付。

如果不想付费,可以启用Chrome的开发者模式,直接加载解压后的插件。

4.1 学会使用Git和Github

利用AI学习如何将插件发布到Github。例如,使用如下的Prompt:

bash
我有一个Chrome插件开发好了,我想把它发布到Github上该如何操作,一步一步教我。

4.2 让AI帮忙改写readme

我先编写一个中文版本的readme,再请GPT帮忙翻译成中英文双语版本。还可以通过Markdown语法添加中英文跳转链接。

5. 发布到Chrome扩展商店

我参考了大佬分享的教程,详细步骤如下:

  1. 在Chrome扩展商店创建新项目;
  2. 填写必要信息,包括域名和隐私声明;
  3. 上传插件图标和截图,确保符合商店要求。

5.1 关于提审的经验

  • 审核资料:插件权限说明用中文写清楚,GPT可以帮助润色;
  • 隐私声明her.fiit.ai 由Claude生成文案;
  • 审核时间:Chrome审核较快,一般2个工作日内完成。

6. 最后

通过这个项目,我不仅掌握了Chrome插件的开发流程,还体验了使用AI工具简化开发的乐趣。如果你也对这个插件感兴趣,欢迎访问以下页面下载使用:

📎

(0)
上一篇 2025年2月17日
下一篇 2025年2月17日

相关推荐