19 Ładowanie danych
19.1 Obsługa plików csv
Funkcja pandas.read_csv
Dokumentacja: link
Wybrane argumenty:
filepath
- ścieżka dostępusep=_NoDefault.no_default, delimiter=None
- separatorheader='infer'
- nagłówek - domyślnie nazwy kolumn, ew.header=None
oznacza brak nagłówkaindex_col=None
- ustalenie kolumny na indeksy (nazwy wierszy)thousands=None
- separator tysięcznydecimal='.'
- separator dziesiętny
Zapis pandas.DataFrame.to_csv
Dokumentacja: link
19.2 Obsługa plików z Excela
Funkcja pandas.read_excel
https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html
** Ważne: trzeba zainstalować bibliotekę openpyxl
do importu .xlsx oraz xlrd
do importu .xls (nie trzeba ich importować w kodzie jawnie w większości wypadków)
Wybrane argumenty:
io
- ścieżka dostępusheet_name=0
- nazwa arkuszaheader='infer'
- nagłówek - domyślnie nazwy kolumn, ew.header=None
oznacza brak nagłówkaindex_col=None
- ustalenie kolumny na indeksy (nazwy wierszy)thousands=None
- separator tysięcznydecimal='.'
- separator dziesiętny
Ćwiczenie: (ex10.py
)
Poćwicz ładowanie danych z plików
19.3 Obsługa sqllite3
import pandas as pd
from sqlite3 import connect
= connect('sales_data2.db')
conn = pd.read_sql("SELECT * FROM sales_data", con=conn) data