大家好,欢迎来到 Crossin的编程教室 ! 上次我们讨论了ChatGPT在辅助编程学习上的一些用法: 既然ChatGPT可以理解并生成代码,那么自然而然,它的作用不仅仅是帮助学习代码,同样也可以直接用在实际的软件开发当中。 对于网页上的数据采集及处理是Python的常见应用场景之一。我们来看下ChatGPT是不是也能完成这样的任务。 假设我们现在需要抓取并整理某个网页上的表格数据: https:///static/score.html 我们直接来问问ChatGPT,能不能给个抓取的代码: ChatGPT给了我们一份代码,但很遗憾,把这个代码复制到编辑器中运行后,生成的Excel是空的。 简单调试后发现,原来是因为页面上的表头元素用的是<th>标签 而ChatGPT因为没有获知具体的页面代码信息,直接当做<td>标签来处理,所以没采集到表头信息。 这种情况下,我们可以手动对代码做一些修改。 或者,我们点击回答下方的“Regenerate response”,让它重新回答一次试试: 这次ChatGPT给出的代码比之前简洁:
运行后,成功得到了我们要的结果: 顺利拿到数据后,我们再进一步,让ChatGPT来对数据进行排序。当然,在排序前,我们需要告诉它关于表格内容的必要信息: 代码:
这次,ChatGPT完美实现了我们提出的需求: 可以看出,虽然ChatGPT很强大,但并不能保证每次生成的代码都是完美,仍然可能需要引导它修正或人工干预。 但即便如此,它也已经算得上一个十分得力的编程助手,可以大大提高开发效率。尤其像数据处理这种场景,以往开发时常常需要查找各种函数及其参数的使用方法。 我现在做数据分析已经快离不开它了。 |
|