丟掉Excel,手把手教你用Python做可視化,還能調(diào)節(jié)動(dòng)畫(huà)絲滑度
可以生成Gif和MP4格式
Pine 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
數(shù)據(jù)可視化動(dòng)畫(huà)還在用Excel做?
現(xiàn)在一個(gè)簡(jiǎn)單的Python包就能分分鐘搞定!
而且生成的動(dòng)畫(huà)也足夠絲滑,效果是醬紫的:
這是一位專攻Python語(yǔ)言的程序員開(kāi)發(fā)的安裝包,名叫Pynimate。
目前可以直接通過(guò)PyPI安裝使用。
使用指南
想要使用Pynimate,直接import一下就行。
import pynimate as nim
輸入數(shù)據(jù)后,Pynimate將使用函數(shù)Barplot()來(lái)創(chuàng)建條形數(shù)據(jù)動(dòng)畫(huà)。
而創(chuàng)建這種動(dòng)畫(huà),輸入的數(shù)據(jù)必須是pandas數(shù)據(jù)結(jié)構(gòu)(如下),其中將時(shí)間列設(shè)置為索引,換句話說(shuō)索引代表的是自變量。
time, col1, col2, col3
2012 1 2 1
2013 1 1 2
2014 2 1.5 3
2015 2.5 2 3.5
具體的代碼形式如下:
import pandas as pd
df = pd.read_csv('data'csv').set_index('time')
比如要處理具體的數(shù)據(jù),寫(xiě)成代碼應(yīng)該是這樣子的。
df = pd.DataFrame(
{
"time": ["1960-01-01", "1961-01-01", "1962-01-01"],
"Afghanistan": [1, 2, 3],
"Angola": [2, 3, 4],
"Albania": [1, 2, 5],
"USA": [5, 3, 4],
"Argentina": [1, 4, 5],
}
).set_index("time")
此外,要制作條形數(shù)據(jù)動(dòng)畫(huà),Barplot還有三個(gè)必需的參數(shù)得注意:data、time_format和ip_freq(Interpolation frequency)。
data就是表格的數(shù)據(jù),這里也就不再贅述。
time_format是指數(shù)據(jù)索引的時(shí)間日期格式,一般為:”%Y-%m-%d”。
最后是ip_freq,它是制作動(dòng)畫(huà)中比較關(guān)鍵的一步,通過(guò)線性插值使動(dòng)畫(huà)更加流暢絲滑。
一般來(lái)說(shuō),并不是所有的原始數(shù)據(jù)都適合做成動(dòng)畫(huà),現(xiàn)在一個(gè)典型的視頻是24fps,即每秒有24幀。
舉個(gè)栗子,下面這個(gè)表格中的數(shù)據(jù)只有三個(gè)時(shí)間點(diǎn),按理說(shuō)只能生成3幀視頻,最終動(dòng)畫(huà)也只有3/24秒。
time, col1, col2
2012 1 3
2013 2 2
2014 3 1
這時(shí)候,ip_freq插值(線性)就開(kāi)始發(fā)揮作用了,如果插值是一個(gè)季度,則得出的數(shù)據(jù)就變成了這樣:
time col1 col2
2012-01-01 1.00 3.00
2012-04-01 1.25 2.75
2012-07-01 1.50 2.50
2012-10-01 1.75 2.25
2013-01-01 2.00 2.00
2013-04-01 2.25 1.75
2013-07-01 2.50 1.50
2013-10-01 2.75 1.25
2014-01-01 3.00 1.00
具體的插值時(shí)間間隔為多久,則要視具體的數(shù)據(jù)而定,一般繪制大數(shù)據(jù)時(shí),設(shè)置為ip_freq = None。
至此,就能生成數(shù)據(jù)動(dòng)畫(huà)了,完整代碼如下所示:
from matplotlib import pyplot as plt
import pandas as pd
import pynimate as nim
df = pd.DataFrame(
{
"time": ["1960-01-01", "1961-01-01", "1962-01-01"],
"Afghanistan": [1, 2, 3],
"Angola": [2, 3, 4],
"Albania": [1, 2, 5],
"USA": [5, 3, 4],
"Argentina": [1, 4, 5],
}
).set_index("time")
cnv = nim.Canvas()
bar = nim.Barplot(df, "%Y-%m-%d", "2d")
bar.set_time(callback=lambda i, datafier: datafier.data.index[i].year)
cnv.add_plot(bar)
cnv.animate()
plt.show()
這是插值為兩天,生成的動(dòng)畫(huà)效果。
最后還有一個(gè)問(wèn)題,那就是保存動(dòng)畫(huà),有兩個(gè)格式可以選擇:gif或者mp4。
保存為動(dòng)圖一般使用:
cnv.save("file", 24, "gif")
若要保存為mp4的話,ffmpeg是個(gè)不錯(cuò)的選擇,它是保存為mp4的標(biāo)準(zhǔn)編寫(xiě)器。
pip install ffmpeg-python
或者:
conda install ffmpeg
當(dāng)然,同樣也可以使用Canvas.save()來(lái)保存。
cnv.save("file", 24 ,"mp4")
作者介紹
julkar9,Python/Flutter 開(kāi)發(fā)人員,研究的方向?yàn)?strong>數(shù)據(jù)分析與可視化。
小哥表示,Pynimate還會(huì)不斷更新,目前正在接受大家的反饋,之后還會(huì)上線等值區(qū)域圖等功能。
他還開(kāi)發(fā)了一個(gè)應(yīng)用程序:Chatmetry,同樣也與數(shù)據(jù)統(tǒng)計(jì)有關(guān),是一個(gè)用于創(chuàng)建whatsapp聊天統(tǒng)計(jì)數(shù)據(jù)的機(jī)器人應(yīng)用程序。
這個(gè)程序可以從導(dǎo)出的聊天中生成各種統(tǒng)計(jì)信息,同時(shí)支持個(gè)人和群組聊天,并且是完全離線的,既不會(huì)保存也不會(huì)共享。
傳送門(mén):
https://julkaar9.github.io/pynimate/