HyperAI超神经

不久前，一家科技初创公司正在构建一个让用户通过简单指令来创建网页应用的平台。在利用大型语言模型（LLM）生成源代码的过程中，他们遇到了一系列问题，其中之一便是前端代码中出现的幻影图像URL。这些URL指向的往往并不是有效的网络图片，这不仅影响用户体验，还导致页面加载失败。为了克服这一挑战，团队探讨了几种解决方案，并最终选择了利用抽象语法树（AST）的方法。在尝试解决方案之前，可以将问题分解为四个步骤：在代码中找到所有涉及图像的实例。使用上下文生成每个图像相关的描述。利用文本到图像的模型生成实际图片。将生成的图像URL替换到代码中的相应位置。解决方案一：正则表达式最初，团队考虑使用正则表达式来匹配代码中的图像元素，但这种方法存在几个问题：图像在JSX中可以有多种形式，如HTML <img> 标签或框架特定的 <Image> 标签。有时图像可能是自定义组件，如 <ProfileImage>。当图像属性引用JavaScript中的列表或对象时，正则表达式无法处理。解决方案二：LLM 随后，团队思考是否可以通过将代码输入LLM来提取所有图像实例，虽然LLM能够智能地识别各种情况，但这也会带来一些问题：过度使用：对于这种相对简单的任务，使用强大的LLM显得有些大材小用了。成本：尽管每次调用的费用不高，但长期累积仍会形成不小的开支。延迟：LLM的API调用通常需要几秒钟才能返回结果，会影响平台的响应速度。非确定性：LLM的行为具有一定的随机性，可能会在某些情况下失败。最终解决方案：AST 团队决定使用AST（抽象语法树）来解决这个问题。AST是一种源代码的“树状”表示方式，可以将代码分解为语法组件，并通过树结构进行遍历。使用Babel库，团队可以轻松地解析JavaScript/TypeScript代码并构建AST。以下是具体的实现步骤：构建AST：使用@babel/parser解析源代码，生成AST树。遍历AST：使用@babel/traverse遍历AST，查找所有匹配条件的图像节点。处理对象字面量：查找 src 或 url 属性。处理JSX元素：查找 <img> 和 <Image> 标签，并进一步检查 src 属性是否为字符串字面量。更新节点：使用@babel/types库创建新的字符串字面量节点。更新或添加 alt 属性。生成新代码：使用@babel/generator将修改后的AST转换回源代码。通过这种方法，团队成功解决了生成代码中的幻影图像URL问题，而不需要依赖不稳定的LLM调用。下面是一个示例，展示了如何从原始代码中找到并替换图像URL： ```javascript // 输入代码 export default function EcommerceTShirts() { const [menuOpen, setMenuOpen] = useState(false); const [searchOpen, setSearchOpen] = useState(false); const hats = [ { id: 1, name: "Simple Hat", price: "$24.99", image: "/hat.jpg", alt: "existing" }, { id: 2, name: "New Hat", price: "$19.99", image: "/hat-new.jpg" }, ]; return ( ... ... ); } // 输出代码 export default function EcommerceTShirts() { const [menuOpen, setMenuOpen] = useState(false); const [searchOpen, setSearchOpen] = useState(false); const hats = [ { id: 1, name: "Simple Hat", price: "$24.99", image: "s3.productx.hat.jpg", alt: "A simple classic hat in a neutral tone displayed on a flat surface" }, { id: 2, name: "New Hat", price: "$19.99", image: "s3.productx.hat-new.jpg", alt: "A modern-style hat with a minimalist logo on the front panel" }, ]; return ( ... ... ); } ``` 业内评价与公司背景这种方法得到了业内的广泛认可，特别是那些关注高效开发工具的开发者们。它不仅解决了生成代码中的图像URL问题，还保持了代码的结构完整性和语法正确性。此外，AST的应用范围远不止于此，如Aider在博客中提到的LLM代码审查工具，以及GritQL中大規模代码维护和操作的能力，都证明了AST在现代软件开发中的重要价值。该公司是一家专注于生成式AI应用的初创企业，其目标是通过创新技术简化复杂任务，提高开发效率。如果想了解更多生成式AI领域的最新动态，可以关注他们的LinkedIn及Zeniteq账号，订阅他们的 newsletter 和 YouTube 频道。让我们共同努力，塑造AI的未来！

利用抽象语法树优化AI生成的前端代码：解决幻觉图像URL问题

Related Links