Analiza și vizualizarea datelor folosind notele instructorului Python
Instalați pachetele necesare pentru atelier
Vă rugăm să urmați instrucțiunile din documentul de instalare pentru a instala programele necesare pentru această lecție. Dacă găsiți probleme, vă rugăm să creați un problema cu eticheta Prioritate ridicată.
Verificarea facilităților
În directorul _include/scripts veți găsi un scenariu numit check_env.py. Verifică funcționalitatea versiunii instalate a Anaconda.
În mod implicit, Data Carpentry nu necesită ca oamenii să descarce depozitul complet cu toate scripturile și butoanele. Prin urmare, în calitate de instructor, trebuie să decideți cum doriți să furnizați acest script elevilor, dacă decideți să faceți acest lucru. Pentru ao utiliza, elevii pot naviga în terminalul lor către _include/scripturi și pot rula următoarele:
Dacă studenții primesc o AssertionError, aceasta vă va informa cum să vă ajutați la corectarea instalării. În caz contrar, vă va spune că sistemul este gata pentru Tâmplăria de date!
01-scurt-introducere-la-Python
Provocări legate de tupluri
Ce se întâmplă când rulați a_tuple [2] = 5 ?
Deoarece tuplul este imuabil, nu acceptă atribuirea articolelor. Elementele listei pot fi modificate individual.
Ce vă spune tipul (a_tuple) despre a_tuple ?
Dicționar provocări
- Modificarea dicționarelor: 2. Reatribuiți a doua valoare.
Asigurați-vă că clarificați și faptul că accesarea „celei de-a doua valori” este legată de numele cheii. Adăugați de exemplu rev [10] = "zece" pentru a clarifica că nu este vorba despre poziție.
02-începând cu date
Notă despre bug-uri
Pandas surveys_df ['weight']. Describe () poate returna o eroare în timpul rulării.
Provocări legate de DataFrames
Numele coloanelor. (Opțional: afișează surveys_df.columns [4] = "plotid". Indexul nu este modificabil; se recapitulează din episodul anterior. Adaptarea numelui se face prin funcția de redenumire: surveys_df.rename (coloane =))
surveys_df.head (). De asemenea, ce înseamnă surveys_df.head (15) ?
Afișați primele 5 rânduri. Afișați primele 15 rânduri.
Afișați ultimele 15 rânduri.
surveys_df.shape. Luați notă de ieșirea formei - Care este formatul ieșirii atributului care returnează forma unui cadru de date?
Provocări legate de calcularea statisticilor din date
Creați o listă a ID-urilor site-ului plot_id care se află în datele sondajului surveys_df. Să numim această listă site_names. Câte site-uri sunt în date? Câte specii există în date?
plot_names = pd.unique (surveys_df ["plot_id"]). Numărul ID-urilor site-ului: plot_names.size sau len (plot_names). Numărul de specii din date: len (pd.unique (surveys_df ["specie"]))
Care este diferența dintre len (plot_names) și surveys_df ['plot_id']. Nunique () ?
Ambele rezultă în același rezultat, servind ca modalități alternative de obținere a valorilor unice. nunique combină numărarea cu extragerea valorilor unice.
Provocări în cluster
Câte observații sunt femele F și câte bărbați M ?
Ce se întâmplă atunci când grupați peste două coloane folosind următoarea declarație și apoi luați valorile medii?
Valoarea medie este calculată pentru fiecare combinație de plot_id și sex. Rețineți că media nu are sens pentru fiecare variabilă, deci o puteți specifica pe coloană: de exemplu, dacă doriți să cunoașteți ultimul an înregistrat, mediana lungimilor picioarelor și valoarea medie a greutății pentru fiecare combinație de complot și sex:
- Calculează statistici descriptive ale greutății pentru fiecare plot_id .
Ce altă modalitate există pentru a crea o listă de specii și a o asocia cu numărul de număr al eșantioanelor de date?
În loc să extrageți și apoi să numărați coloanele rezultate din groupby, puteți, de asemenea, să numărați împreună cu groupby (pe toate coloanele) și să construiți o selecție din DataFrame rezultat: surveys_df.groupby ('species_id'). Count () ["record_id"]
Provocări grafice
- Creați un grafic al greutății medii a speciei în funcție de sit.

- Creați un grafic al totalului bărbaților față de totalul femeilor pentru întregul set de date.
03-index-slice-subset
Sfat: utilizați metoda .head () pe parcursul acestei lecții pentru a vă menține ecranul curat. Încurajați elevii să testeze comenzile cu și fără .head () pentru a consolida utilitatea acestui instrument și apoi să-l folosească sau nu, în funcție de preferința lor. De exemplu, dacă un student își exprimă îngrijorarea cu privire la menținerea pasului cu tastarea, anunțați-o că poate evita .head (), dar că o veți folosi pentru a menține mai multe linii de cod anterioare vizibile.