likes
comments
collection
share

Python in Excel的一些使用心得

作者站长头像
站长
· 阅读数 8

获得Python in Excel的preview之后, 就在任意的Excel单元格里可以敲=py(来写Python代码了。不过Python in Excel并没有什么专门的文档, 只有一些Get Started教程, 比如link 1, link 2, 剩下的就是pandas, matplotlib, seaborn等lib的文章,和Python in Excel并没有什么关系。所以刚进入Python in Excel时,对这个新的环境会有很多疑问,这篇文章主要是分享一些我的一些理解和使用心得。

从单元格取值

在Python in Excel中, 我们可以用xl()函数获取从单元格,列,行乃至sheet中获取数据。如果要获取其他sheet中的数据,按照xl('SheetName!A1:B2')这样的方式写就可以. 如果 xl()函数引用的值的范围超过了一个单元格,那么它返回的值是一个DataFrame对象.

如果在Excel中多单元格设置了类型(category),那么xl()返回的类型的对应管辖如下所示:

Python in Excel的一些使用心得

Python运行时

Python in Excel的Python运行时(runtime)是部署在Microsoft Cloud上的,所以在Excel中敲下 ctrl + enter时,Excel中的代码和数据都会被传送到云端执行,执行完从云端取回结果。

从Excel菜单的Formulas -> Python -> Initiallization,我们可以看到这个运行时是如何被初始化的,有哪些库会被默认加载,哪些默认值会被设置。

Python in Excel的一些使用心得

除了像 numpy, pandas(其他你可以import的库可以参考这篇文档 )这些常用的数据处理的库之外,excel这个库(或者应该被称作一个依赖)主要负责Excel中的数据转换,以及Excel与Microsoft Cloud的数据传输等任务,比如:用于从Excel的sheet中获取数据的xl()函数; 你也可以通过excel.uploadeddata.get_runtime_id()函数来获取一个当前Python运行时的uuid。我没有找到微软官方关于excel这个库的文档,可以需要以后在进一步挖掘了。

一个打开的Excel文档中的全部sheet以及sheet中的全部单元格都会共享同一个Python运行时。这就意味着如果你在任意一个单元格中声明的函数、变量和类,都可以在其他的的单元格的代码中引用到。举个例子,

Python in Excel的一些使用心得

网络请求

我们实际上是可以在Python in Excel的Python代码中import像socket, http, reqeuests这些库的。不过可能是出于安全原因,在运行时的容器中应该是存在防火墙或者是禁止掉了网络的使用,所以我们并不能实际发出任何请求。这样的话,我们也就不能动态在Python in Excel的代码中加载任何代码和外部数据。

如果未来版本的Python in Excel提供了私有化部署的解决方案,网络请求应该不是什么问题,我也不用担心自己的数据有被微软乃至其他第三方获取的可能性。

检查Python对象的值

在Python shell中(或者IDLE),我们经常可以使用dir(), help(), type()这些辅助方法来检查当前Python运行时中的一些对象和类的结构,或者是获取相关的使用帮助,这样绝对是编程时的调试神器。在Python in Excel中,虽然Excel并没有给我们一个shell,但我们也可以做类似的事情。

举个例子,我们可以对excel模块使用dir()函数,来看看excel模块中有哪些方法,并把这些方法返回到一个column中:

Python in Excel的一些使用心得

我们可以把对一些对象的值的检查工作组织成一个list来返回,这样可以节省不少在云端执行代码的时间:

Python in Excel的一些使用心得

除了检查对模块的内容,我们对Python代码中的任意中间值进行检查,这样就几乎可以像使用Jupyter一样的来使用Python in Excel了。

把Excel的sheet作为库来加载

前文已经提到,我们不能动态的通过网络请求来加载远端的Python代码。如果我们想使用一些库,比如一些自己的常用代码,我们还是需要一些方法来加载它们。

目前的一些临时的解决方案是把需要复用的代码都单独的放在一个sheet里(保存在独立的.xlsx文件中),这样在需要使用这些代码时,我们就可以把整个sheet拷贝到当前的.xlsx文件中来加载。

错误信息的处理

目前Python in Excel只会返回很简单的错误信息,也就是Exception对象的message中的内容。如果你需要详细的stack trace的信息,可以封装一下try/except代码块,让Python in Excel把错误栈作为一个list返回回来。比如:

import traceback

ret = ''

try:
    # your code or function
    ret = xxx()
except:
    ret = traceback.format_exc().split('\n')

ret

上面代码中的.split('\n') 是为了把错误信息切割成多个单元格来展示(每个单元格一行,整体在一个column中)。为了更好的展示错误信息,最好把单元格的字体设置为等宽字体。

其他值得注意的地方

  • Python in Excel的多行输出会忽略掉换行符\n
  • xl()函数可以正确从单元格中读取换行符\n
  • Python in Excel不能读取插入的对象,比如作为附件的文件。
  • 目前还不能在Python in Excel指定返回值输出到的单元格,只能以=py(所在的当前单元格为基点来输出。

本文的英文版本见 medium.com/@socratesle…