分享

Jupyter Notebooks嵌入Excel并替代VBA

 网摘文苑 2021-01-17
Jupyter Notebooks嵌入Excel并替代VBA

以前,Excel和Python Jupyter Notebook之间我们只能选择一个。 但是现在随着PyXLL-Jupyter软件包的推出,可以将两者一起使用。

在本文中,我将向你展示如何设置在Excel中运行的Jupyter Notebook。 在这两者之间共享数据,甚至可以从Excel工作簿调用Jupyter笔记本中编写的Python函数!

开始

首先,要在Excel中运行Python代码,你需要使用PyXLL包。 PyXLL使我们可以将Python集成到Excel中,并使用Python代替VBA。 要安装PyXLL Excel加载项' pip install pyxll',然后使用PyXLL命令行工具安装Excel的加载项:

>> pip install pyxll >> pyxll install

安装完PyXLL Excel插件,下一步就是安装PyXLL -jupyter软件包。该软件包提供了PyXLL和Jupyter之间的链接,因此我们可以在Excel内使用Jupyter笔记本。

使用pip安装pyxll-jupyter包:

>> pip install pyxll-jupyter

一旦安装了PyXLL Excel加载项和PyXLL-Jupyter软件包后,启动Excel将在PyXLL选项卡中看到一个新的' Jupyter'按钮。

Jupyter Notebooks嵌入Excel并替代VBA

单击此按钮可在Excel工作簿的侧面板中打开Jupyter笔记本。 该面板是Excel界面的一部分,可以通过拖放操作取消停靠或停靠在其他位置。

在Jupyter面板中,你可以选择一个现有的笔记本或创建一个新的笔记本。 要创建一个新的笔记本,请选择'新建'按钮,然后选择' Python 3'。

Jupyter Notebooks嵌入Excel并替代VBA
Jupyter Notebooks嵌入Excel并替代VBA

如何使用

现在,你已经在Excel中运行了完整的Jupyter笔记本! 但是,这有什么好处呢? 这比在Excel外部运行笔记本更好?

好了,现在你可以使用Excel处理数据,并使用Python处理相同的数据。 将Excel用作用于组织和可视化数据的交互式操作,无缝切换到Python以使用更复杂的功能。

将Jupyter笔记本用作草稿板,以试用Python代码。在Jupyter笔记本上完全用Python编写Excel函数,并进行实时测试。开发完一个有用的可重用函数后,将其添加到PyXLL Python项目中。这样你每次使用Excel时都可以使用相同的函数。

在本文的其余部分,我将向你展示如何:

· 使用Jupyter笔记本在Excel和Python之间共享数据

· 在笔记本上写Excel工作表函数(udf)

· 脚本Excel与Python代替VBA

从Excel获取数据到Python

因为PyXLL在与Excel相同的进程中运行Python,所以用Python访问Excel数据以及在Python和Excel之间快速调用。

为了使事情尽可能简单,pyxll-jupyter包附带了一些IPython'魔法'函数,可以在你的Jupyter笔记本中使用。

% xl_get

Jupyter Notebooks嵌入Excel并替代VBA

excel sheet 与 Pandas DataFrames 同步

使用魔术函数'%xlget'来获取Python中当前的Excel选择。 在Excel中创建数据表, 选择左上角(或整个范围),然后在Jupyter笔记本中输入'%xlget',瞧! Excel表现在是pandas DataFrame。

%xl_get魔术函数有几个选项:

-c或--cell。 传递单元格的地址以获取值,例如%xl_get --cell A1:D5。 -t或--type。 指定获取值时要使用的数据类型,例如%xl_get --type numpy_array。 -x或--no-auto-resize。 仅获取选定范围或给定范围的数据。 不要扩展到包括周围的数据范围。

PyXLL还有其他与Excel交互以将数据读入Python的方式。 '%xl_get'魔术功能只是使事情变得更简单! 当Jupyter笔记本在Excel中运行时,所有其他方法(例如,使用XLCell类,Excel的COM API甚至xlwings)仍然可用。

提示:可以为魔术函数的结果分配一个变量! 例如,尝试' df =%xl_get'。

将Python中的数据移回Excel

从Python到Excel的另一种传输方式也可以正常工作。 无论你是使用Python加载数据集并将其传输到Excel工作簿,还是通过Excel处理数据集并希望将结果返回Excel,从Python复制数据到Excel都很容易。

%xl_set

Jupyter Notebooks嵌入Excel并替代VBA

魔术函数'%xlset'获取一个Python对象并将其写入Excel。在Excel中是否有想要的数据框' df'?只需使用'%xlset df',它将被写入Excel中的当前选择。

与%xlget一样,%xlset也具有一系列选项来控制其行为。你甚至可以使用PyXLL的单元格格式设置功能在将结果写入Excel的同时自动应用格式设置。

-c或--cell。将值写入的单元格地址,例如%xl_set VALUE --cell A1。-t或--type。将值写入Excel时要使用的数据类型说明符,例如%xl_set VALUE --type dataframe <index = False>。-f或--formatter。 PyXLL单元格格式化程序对象,例如%xl_set VALUE --formatter DataFrameFormatter()。请参阅单元格格式。-x或--no-auto-resize。不要自动调整范围大小以适合数据。仅将值写入当前选择或指定范围。

与%xlget一样,%xlset只是一个快捷方式,你可能已与PyXLL一起使用的所有其他写回Excel的方式仍然可以在Jupyter笔记本中使用。

在Excel中使用Python图(matplotlib / plotly等)

关于数据处理的一大优点是可用的功能强大的绘图程序包。 例如df.plot()

PyXLL集成了所有主要的绘图库,因此你也可以在Excel中充分利用它们。 这包括matplotlib(由pandas使用),plotly,bokeh和altair。

%xl_plot

Jupyter Notebooks嵌入Excel并替代VBA

使用'%xlplot'在Excel中绘制任何Python图表。 从一个受支持的绘图库中向其传递任何图形对象,或使用最后一个pyplot图形。 使用pandas plot的效果也很好,例如。 %xlplot df.plot(kind='scatter').

%xl_plot魔术函数具有一些选项来控制其工作方式:

-n或--name。 Excel中图片对象的名称。 如果使用已经存在的图片名称,则该图片将被替换。 -c或--cell。 用作新图片位置的单元格地址。 如果图片已经存在,则无效。 -w或--width。 Excel中图片的宽度(以磅为单位)。 如果更新现有图片,则无效。 -h或--height。 Excel中图片的高度(以磅为单位)。 如果更新现有图片,则无效。

%xl_plot是pyxll.plot函数的快捷方式。

从Excel调用Python函数

你可以直接从Excel工作簿中调用Python函数,而不是在Excel和Jupyter之间不断移动数据然后运行一些Python代码

PyXLL的主要用例之一是用Python编写自定义Excel工作表函数(或' UDF')。 这用于在使用Python函数构建的Excel中构建模型,这些函数当然可以使用其他Python库(例如pandas和scipy)。

你也可以在Jupyter笔记本中编写Excel工作表函数。 这是在不离开Excel即可使用Python IDE的情况下尝试想法的绝佳方法。

自己试试吧。 编写一个简单的函数,然后将' pyxll.xl_func'修饰符添加到你的函数中:

from pyxll import xl_func@xl_funcdef test_func(a, b, c):    # This function can be called from Excel!    return (a * b) + c

输入代码并在Jupyter中运行单元格后,即可立即从Excel工作簿中调用Python函数。

不只是简单的功能。 你可以将整个数据范围作为pandas DataFrames传递给函数,并返回任何Python类型,包括numpy数组和DataFrames! 你可以通过给@xl_func装饰器一个参数字符串来告诉PyXLL期望什么类型。

例如,尝试以下方法:

from pyxll import xl_func# The 'signature' tells PyXLL how to convert the arguments# and returned value.@xl_func('dataframe df: dataframe<index=True>', auto_resize=True)def df_describe(df): # 'df' is a pandas DataFrame built from the range passed # to this function. desc = df.describe() # 'desc' is a new DataFrame, which PyXLL will convert to # a range of values when returning to Excel. return desc

现在,你可以编写复杂的Python函数来进行数据转换和分析,Excel中如何调用或排序这些函数。 更改输入会导致调用函数,并且计算出的输出会实时更新,这与你期望的一样!

在Excel中使用Python而不是VBA的脚本

你是否知道在VBA中可以执行的所有操作也可以在Python中完成?编写VBA时将使用Excel对象模型,但是Python也提供相同的API。

在Excel中运行的Jupyter笔记本中,可以使用整个Excel对象模型,因此你可以使用与Excel VBA编辑器中完全相同的方式编写Excel脚本。

由于PyXLL在Excel进程内运行Python,因此从Python调用Excel不会对性能造成任何影响。也可以从外部Python进程调用Excel,但这通常要慢得多。在Excel中运行Jupyter笔记本也使一切变得更加便捷!

使用PyXLL的xl_app函数获取' Excel.Application'对象,该对象等效于VBA中的Application对象。尝试进行诸如获取当前选择和更改单元格内部颜色之类的操作。弄清楚如何使用Excel对象模型进行操作的一种好方法是记录VBA宏,然后将该宏转换为Python! PyXLL文档页面Python作为VBA的替代品提供了一些有关如何做到这一点的技巧。

Jupyter Notebooks嵌入Excel并替代VBA

总结

Python是VBA的强大替代品。 使用PyXLL,你可以完全用Python编写功能齐全的Excel加载项。 Excel是一种出色的交互式计算工具。 添加Python和Jupyter将Excel提升到一个全新的水平。

使用Jupyter笔记本编写的代码可以轻松地重构为独立的Python包,以创建Excel工具包来为直观的工作簿和仪表板提供动力。 任何Excel用户都将能够利用使用PyXLL编写的Python工具,而无需任何Python知识。

最后 PyXLL的官网地址:www.pyxll.com

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多