Hello Diu Túp, hôm nay chúng mình xin giới thiệu đến các bạn Series “Tự Học Data Science Cho Người Mới Bắt Đầu”. Và chủ đề của Video hôm này là “Làm Quen vs Pandas và DataFrame” 🤩 !
Link Download Dataset trong Video:
Data Science (hay còn gọi là Khoa học dữ liệu) trở thành một trong những ngành có nhu cầu nhân lực cao nhất ở thế kỷ 21. Thuật ngữ “Data Science” cũng là thuật ngữ được nhiều người nhắc đến hằng ngày. Data Science được định nghĩa là tất cả những gì về thu thập, khai thác và phân tích dữ liệu để tìm ra insight giá trị. Sau đó trực quan hóa các Insight cho các bên liên quan, để chuyển hóa Insight thành hành động. Đây là lĩnh vực đa ngành sử dụng các phương pháp và quy trình khoa học để rút ra insight từ dữ liệu.
Pandas là là thư viện mã nguồn mở với hiệu năng cao cho phân tích dữ liệu trong Python được phát triển bởi Wes McKinney trong năm 2008. Chỉ với hơn 1 năm phát triển nó đã trở thành một thư viện chuẩn cho việc phân tích dữ liệu khi dùng Python. Pandas là một thư viện mã nguồn mở được xây dựng dựa trên NumPy, sử dụng thao tác và phân tích dữ liệu, được thiết kế để cho phép bạn làm việc với dữ liệu được gắn nhãn hoặc quan hệ theo cách trực quan hơn
– Có thể xử lý tập dữ liệu khác nhau về định dạng: chuỗi thời gian, bảng không đồng nhất, ma trận dữ liệu
– Khả năng import dữ liệu từ nhiều nguồn khác nhau như CSV, DB/SQL
– Có thể xử lý vô số phép toán cho tập dữ liệu: subsetting, slicing, filtering, merging, groupBy, re-ordering, and re-shaping,..
– Xử lý dữ liệu mất mát theo ý người dùng mong muốn: bỏ qua hoặc chuyển sang 0
– Xử lý, phân tích dữ liệu tốt như mô hình hoá và thống kê
– Tích hợp tốt với các thư viện khác của python
– Cung cấp hiệu suất tốt
[0:00] Giới thiệu về Data Science
[1:30] Giới thiệu về CodeXplore Github Repo
Link:
[3:10] Hướng dẫn cài đặt và sử dụng Anaconda
Link:
[4:35] Hướng dẫn sử dụng Jupyter Notebook
[8:00] pd.read_csv()
[10:15] df.shape
[11:10] df.info()
[12:35] df.columns
[13:15] df.index
[14:00] df.describe()
[16:38] .loc()
[22:45] .iloc()
[26:59] .dtype
[28:14] .apply()
[32:50] Nhân các column trong Data Frame và tạo Column mới
[36:36] .groupby()
[38:59] .sort_values()
[40:45] .value_count()
[41:39] .nuique()
Full Series “Tự Học Data Science Cho Người Mới Bắt Đầu”:
Group Hỏi Đáp:
————- ✪ About CodeXplore Channel ✪ ————
CodeXplore là một platform chia sẻ kiến thức về Lập Trình [Coding] dành cho các bạn trẻ Việt Nam từ một cựu du học sinh Sing, hiện đang sống và làm việc tại Singapore.
Channel của mình sẽ focus vào các chủ đề sau:
► [Code] Lập Trình Web – Full-Stack (HTML, CSS, JavaScript, Node JS và React JS) ☞ Future Projects: Deno
► [Code] Interview Preparation (Cấu Trúc Dữ Liệu và Thuật Toán & LeetCode Solutions)
► [Code] Lập Trình Python (Cơ Bản, Lập Trình Hướng Đối Tượng, Lập Trình Game)
► [Xplore] Travel Vlog (Chia sẻ kinh nghiệm đi du lịch và trải nghiệm)
——————
✪ Business inquiries: codexplore.channel@gmail.com
✪ Subscribe:
➥ CodeXplore Social Links:
Fanpage:
Instagram:
GitHub:
———————————————-/————-
© Bản quyền thuộc về CodeXplore
© Copyright by CodeXplore ☞ Do not Reup
#JupyterNotebook #Pandas #DataScienceCơBản
[Video Review đánh giá] Làm Quen vs Pandas và DataFrame | Tự Học Data Science #1
mau ra tiếp series này đi a ơi, hay quá ạ đã đăng ký và like luôn rồi hehe
Cám ơn bạn đã ra những video này nó rất bổ ích và đầy đủ hơn các channel khác. Hy vọng bạn ko drop cái series này nhé <3
Chất lượng quá anh ơi, thêm video nữa nha
anh ơi, e tải cái file thực hành về nhưng nó khác của anh ạ, nó ra hoàn cái linnk gì không à
Hay! Mình đã đăng kí cho bạn, chúc bạn một ngày tốt lành 😍
cảm ơn bạn!
Mình muốn tìm hướng dẫn sử dụng hàm if trong pandas giống như hàm if trong excel thì tìm ở đâu nhỉ. Hy vọng series này bạn đề cập đến vấn đề này.
Hay quá <3
nhờ ad hướng dẫn download file trên github về máy với ạ
Cảm ơn anh video rất hay, mong anh ra nhiều video hơn ♥
A ơi cho em hỏi làm thế nào để số hóa dữ liệu trong các cột vậy anh.
VD : em có cột StudentID có dữ liệu : Std001, Std002, Std001, … nhưng em muốn replace "Std001" -> 1, "Std002" -> 2, tương tự với tất cả dữ liệu còn lại. Nếu có 100 unique values thì phải điền thành các số từ 1 -> 100.
Em cảm ơn.
Đúng là video quá hay đang cần những video như vậy. Cảm ơn bạn đa chia sẻ
Cảm ơn bạn rất nhiếu! Cho mình hỏi
Nếu tiêu đề của các trường dữ liệu là tiếng việt có dấu phải xử lý ntn bạn?
Code: df."Tiếng Việt có dấu" báo lỗi
Quá hay luôn anh ạ
Cảm ơn anh nhé, khi nào ra clip data science nữa anh ơiii
Anh ơi em không tải được file thực hành ạ :((
Làm chuỗi video học python từ cơ bản đến master đi anh ơi
Thanks anh và team đã làm 1 video qua hayyyyyy ạ ^^ Anh cho em hỏi lúc em read_csv như này:
'''import pandas as pd
import numpy as np
#STEP 1: IMPORT DỮ LIỆU
df= pd.read_csv("chipotle.tsv", sep = "t")
df.head(5)'''
Thì nó báo lỗi FileNotFoundError (không tìm được file) là vì sao vậy ạ?
Cảm ơn anh nhé <3
Cám ơn ban, video rất hay!!
Đúng cái mà em đang cần mong anh ra thêm nhiều video hơn về mảng này ạ.Chúc gia đình anh năm mới sức khỏe ạ!
Quá hay
Rất hay và hữu ích, mong chờ những video mới của về data science ạ.
Ủng họ anh ạ!! Cảm ơn anh đã chia sẻ kiến thức <3
hay quá anh ơi, hy vọng anh không drop khóa học này <3
Thanks anh nhé, xem chăm chú từ đầu đến cuối học được hết, khi nào thì anh ra tiếp vậy anh, hóng lắm
Kênh quá chất, cảm ơn bạn
cool!!!
tks iu a
cho em hỏi có khóa học offline không ah
Ad ơi ! Làm sao download chipotle.tsv trên Github về máy được.Xin cảm ơn.
Quá xuất sắc!!!
không uổng công e chờ đợi. Thank you và Chúc mọi người năm mới vui vẻ nhé !!!!!
Cuối năm ad ra khóa chất lượng quá !
serie này rất hấp dẫn với em 😍😍 mong anh sẽ ra video sớm sớm ạ 😁😁
ôí giôì ôi mừng quá mừng quá finally cũng có 1 channel made in Vietnam about coding rôì ôí giôì ôi !
Ủng hộ nhóm
Cám ơn anh nha, mới coi đc mấy hôm mà đã đc học đúng nhu cầu 😁
Nay ông đang vào luồng rồi đấy, ra video nhiều hơn nữa nhé <3
em newbie hiểu bài hơi chậm . cảm ơn anh nhiều lắm ạ
Làm về series AI anh ơi ❤️
Tuyệt quá add ơi
Tuyệt vời. Hy vọng sẽ có những video hay tiếp theo <3
Mình góp ý là bạn nên zoom code to hơn 1 xíu vì nhiêù bạn màn hình nhỏ or xem trên smartphone hơi khó nhìn. Nhưng nhìn chung bạn giảng rất chi tiết cả dễ hiểu. Mong kênh có thể phát triển hơn nữa và ra series về algorithms 🙆
Cho em xin cái hình nền
Thanks ban, cho minh hoi download dataset trong video o dau duoc ban?
Hay quá anh. Mong chờ bài tiếp theo trong series này. Ủng hộ anh.
Đăng kí kênh rồi mà không nhận đc thông báo video 😢