2023 年复习 Pandas 教程(一):DataFrame 与 Series
Pandas 是一个开源的 Python 数据处理库,它提供了一种高效的数据结构 DataFrame(二维表格)和 Series(一维数组),用于快速地处理和分析大型数据集。为了提高效率,我决定重新学习一下 pandas,系统地补一补这几年在查 StackOverflow 的过程中漏下的内容。
Journal of Kaleidoscope
Pandas 是一个开源的 Python 数据处理库,它提供了一种高效的数据结构 DataFrame(二维表格)和 Series(一维数组),用于快速地处理和分析大型数据集。为了提高效率,我决定重新学习一下 pandas,系统地补一补这几年在查 StackOverflow 的过程中漏下的内容。
就在今天,Python 3.11 版本发布了。据 Python 官方的说法,Python 3.11 比 3.10 快了多达 10%~60%:具体可以在官方的 Python 3.11 提速内容查看。又由于 Python 3.10 较 3.9 也有一定程度的性能提升,尝试一下 3.11 似乎就十分的有动力。Anaconda 的主流支持版本仍然停留在 Python 3.9,没有办法直接通过常规方式更新,所以需要一些小技巧。
我们的数电助教和老师很奇怪,并不使用常见的课堂派/爱课堂等方式收作业,而是采用纸质的方式收取作业。最近因为疫情反弹的原因,课程重新改为线上,需要收电子版作业。考虑到用 QQ 或 Email 的方式发作业会混乱不堪,我决定在 1024 程序员节的末尾快速写一个收 .pdf 文件的网站,预计从开写到完成在 1 小时左右,算上上线在 2 小时左右,主要需求就两个:能用且不丢数据。原本打算使用 rust rocket v0.5 的我,最终使用了 python fastapi。