Ketahui Cara Menggabungkan Bingkai Data dalam Python

Ketahui Cara Menggabungkan Bingkai Data dalam Python

Jika anda menggunakan Python, walaupun untuk tugas yang paling mudah, anda mungkin menyedari kepentingan perpustakaan pihak ketiganya. Perpustakaan Pandas, dengan sokongan yang sangat baik untuk DataFrames, adalah salah satu perpustakaan sedemikian.





Anda boleh mengimport berbilang jenis fail ke dalam Python DataFrames dan mencipta pelbagai versi untuk menyimpan set data yang berbeza. Sebaik sahaja anda mengimport data anda menggunakan DataFrames, anda boleh menggabungkannya untuk melakukan analisis terperinci.





Mengatasi Perkara Asas

Sebelum anda mula menggabungkan, anda perlu mempunyai DataFrames untuk digabungkan. Untuk tujuan pembangunan, anda boleh membuat beberapa data palsu untuk bereksperimen.





Buat DataFrames dalam Python

Sebagai langkah pertama, import pustaka Pandas ke dalam fail Python anda. Pandas ialah perpustakaan pihak ketiga yang mengendalikan DataFrames dalam Python. Anda boleh menggunakan import pernyataan untuk menggunakan perpustakaan, seperti berikut:

import pandas as pd

Anda boleh menetapkan alias kepada nama perpustakaan untuk memendekkan rujukan kod anda.



kesakitan adalah sebab utama untuk mencintai kenderaan itu sendiri. dalam Bahasa Inggeris

Anda perlu mencipta kamus, yang boleh anda tukar kepada DataFrames. Untuk hasil terbaik, cipta dua pembolehubah kamus— dict1 dan dict2— untuk menyimpan maklumat tertentu:

dict1 = {"user_id": ["001", "002", "003", "004", "005"], 
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}

dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}

Ingat, anda perlu mempunyai elemen yang sama dalam kedua-dua nilai kamus, untuk bertindak sebagai kunci utama untuk menggabungkan DataFrames anda kemudian.





Tukar Kamus Anda Menjadi DataFrames

Untuk menukar nilai kamus anda kepada DataFrames, anda boleh menggunakan kaedah berikut:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

Sesetengah IDE membenarkan anda menyemak nilai dalam DataFrame dengan merujuk fungsi DataFrame dan menekan Jalankan/Laksanakan . Terdapat banyak IDE yang serasi dengan Python , jadi anda boleh memilih dan memilih yang paling mudah untuk anda pelajari.





  Coretan kod Jupyter Notebook

Setelah anda berpuas hati dengan kandungan DataFrames anda, anda boleh meneruskan ke langkah penggabungan.

Menggabungkan Bingkai Dengan Fungsi Gabungan

Fungsi merge ialah fungsi Python pertama yang anda boleh gunakan untuk menggabungkan dua DataFrames. Fungsi ini mengambil argumen lalai berikut:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

di mana:

  • pd ialah alias untuk perpustakaan Pandas.
  • bercantum ialah fungsi yang menggabungkan DataFrames.
  • DataFrame1 dan DataFrame2 ialah dua DataFrames untuk digabungkan.
  • bagaimana mentakrifkan jenis gabungan.

Beberapa argumen pilihan tambahan tersedia, yang boleh anda gunakan apabila anda mempunyai struktur data yang kompleks.

Anda boleh menggunakan nilai yang berbeza untuk parameter cara mentakrifkan jenis cantuman yang hendak dijalankan. Jenis gabungan ini akan menjadi biasa jika anda sudah menggunakan SQL untuk menyertai jadual pangkalan data .

Gabungan Kiri

Jenis cantuman kiri mengekalkan nilai DataFrame pertama dan menarik nilai padanan daripada DataFrame kedua.

  Coretan kod Jupyter Notebook

Cantuman Kanan

Jenis cantuman yang betul memastikan nilai DataFrame kedua tetap utuh dan menarik nilai padanan daripada DataFrame pertama.

  Coretan kod Jupyter Notebook

Gabungan Dalam

Jenis cantuman dalaman mengekalkan nilai yang sepadan daripada kedua-dua DataFrames dan mengalih keluar nilai yang tidak sepadan.

  Coretan kod Jupyter Notebook

Gabungan Luar

Jenis gabungan luar mengekalkan semua nilai padanan dan tidak sepadan dan menyatukan DataFrames bersama-sama.

  Coretan kod Jupyter Notebook

Cara Menggunakan Fungsi Concat

The concat fungsi ialah pilihan yang fleksibel berbanding dengan beberapa fungsi gabungan Python yang lain. Dengan fungsi concat, anda boleh menggabungkan DataFrames secara menegak dan mendatar.

Walau bagaimanapun, kelemahan menggunakan fungsi ini ialah ia membuang sebarang nilai yang tidak sepadan secara lalai. Seperti beberapa fungsi lain yang berkaitan, fungsi ini mempunyai beberapa hujah, yang mana hanya beberapa sahaja yang penting untuk penggabungan yang berjaya.

concat(dataframes, axis=0, join='outer'/inner)

di mana:

  • concat ialah fungsi yang menyertai DataFrames.
  • bingkai data ialah jujukan DataFrames untuk digabungkan.
  • paksi mewakili arah penyambungan, 0 ialah mendatar, 1 ialah menegak.
  • sertai menentukan sama ada gabungan luar atau dalam.

Menggunakan dua DataFrames di atas, anda boleh mencuba fungsi concat seperti berikut:

# define the dataframes in a list format 
df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function
print(df_merged_concat)

Ketiadaan paksi dan hujah gabungan dalam kod di atas menggabungkan dua set data. Output yang terhasil mempunyai semua entri, tanpa mengira status perlawanan.

Begitu juga, anda boleh menggunakan argumen tambahan untuk mengawal arah dan output fungsi concat.

bagaimana memulakan coretan snapchat dengan pantas

Untuk mengawal output dengan semua entri yang sepadan:

73CF12478840FDAAAAB6993ABE1316D356231DDC

Hasilnya mengandungi semua nilai padanan antara dua DataFrames sahaja.

  Coretan kod Jupyter Notebook

Menggabungkan DataFrames Dengan Python

DataFrames adalah sebahagian daripada Python, dengan mengambil kira fleksibiliti dan fungsinya. Memandangkan penggunaannya yang pelbagai aspek, anda boleh menggunakannya secara meluas untuk melaksanakan pelbagai tugas dengan sangat mudah.

Jika anda masih belajar tentang Python DataFrames, cuba import beberapa fail Excel, kemudian gabungkannya dengan pendekatan yang berbeza.