Hơn 7000 người đã học khóa Tự học SQL cùng Vịt - Cơ bản
Gần 100 bài tập được thiết kế kĩ càng.
Mỗi bài tập đi kèm video giải thích cách làm, mở rộng kiến thức.
Tổng thời lượng video là 500 phút - dài bằng 4 bộ phim chiếu rạp.
Được đăng tải trên Youtube hoàn toàn miễn phí.
Sau khóa cơ bản, hẳn là bạn có nhiều câu hỏi, yêu cầu thực tế đang chờ đợi?
Hơn 7000 người đã học khóa Tự học SQL cùng Vịt - Cơ bản
Gần 100 bài tập được thiết kế kĩ càng.
Mỗi bài tập đi kèm video giải thích cách làm, mở rộng kiến thức.
Tổng thời lượng video là 500 phút - dài bằng 4 bộ phim chiếu rạp.
Được đăng tải trên Youtube hoàn toàn miễn phí.
Sau khóa cơ bản, hẳn là bạn có nhiều câu hỏi, yêu cầu thực tế đang chờ đợi?
Data công ty không sạch thì làm sao để check data?
Check rồi thì làm sao để dữ liệu sạch?
Sạch rồi thì mình có thể làm gì nữa để tận dụng tối đa?
Rồi một số yêu cầu thì cần dùng subquery, window function… và bạn chưa thực sự hiểu.
Vịt có khóa học SQL nâng cao để giúp bạn giải quyết các vấn đề trên.
Bạn sẽ được thử thách với những yêu cầu sát với công việc, làm với dataset lấy từ thực tế.
Bạn sẽ được đưa qua quy trình đầy đủ từ kiểm tra, làm sạch đến làm giàu dữ liệu.
Bạn cũng sẽ học các công cụ nâng cao hơn, giải quyết nhiều yêu cầu khó nhằn hơn.
Đảm bảo chất lượng cho học viên.
Được học thử các video kiến thức.
Hoàn tiền trong vòng 30 ngày nếu không hài lòng với khóa học.
Kết bạn với Vịt, tham gia cộng đồng, tư vấn lộ trình nghề nghiệp :D
Lưu ý: Khóa học này là khóa SQL nâng cao, là phần tiếp theo của khóa SQL cơ bản. Khóa SQL cơ bản Vịt đã đăng hoàn toàn miễn phí trên youtube. Bạn có thể lên youtube và tìm playlist "Tự Học SQL cùng Vịt - Khóa Cơ Bản cho Người Mới Bắt Đầu" để học phần cơ bản trước khi mua khóa học này nha :D
Timeline:
0:00 Giới thiệu Data Quality
0:54 C01 T04
1:43 Cách kiểm tra duplicates
3:07 Phân biệt Primary key và Unique key
4:27 Tiếp tục kiểm tra duplicates
Timeline:
0:00 Loại hình nhà ở
2:46 Số phòng ngủ
Link template: https://docs.google.com/spreadsheets/d/1o6cdNgcq0-fYoRhhnec16zr4SSHfpHDL4e4NmDst77s/copy
Timeline:
0:00 Giới thiệu
1:40 Huyện
2:51 Hierarchy Quận - Huyện
4:29 Giấy tờ pháp lý
5:48 Số tầng
8:37 Diện tích
11:29 Dài, Rộng
13:04 Giá/m2
15:05 Tổng kết
Timeline:
0:00 Giới thiệu
1:22 Kiểm tra duplicates
4:37 Province
5:54 Wind
7:41 Wind direction
8:25 Rain
10:56 Humidity, Cloud
13:45 Date
15:58 Tổng kết
Timeline:
0:00 Giới thiệu
2:27 Table, Relationships
5:21 Data dictionary Tiki Book
7:38 Data dictionary Tiki Book Comment
8:52 Process, Operation
10:20 Cách dữ liệu sinh ra
Timeline:
0:00 Giới thiệu
1:46 Kiểm tra duplicates
3:46 Author
5:39 Hai cột Price
9:19 Quantity
15:14 Category
17:33 N review, Avg rating
20:45 Page
23:31 Manufacturer
Timeline:
0:00 Giới thiệu
0:31 Kiểm tra duplicates
2:13 Product ID
3:04 Thank count
4:04 Rating
5:04 Tổng kết
Tìm đọc về các loại dữ liệu trên SQL:
- https://cloud.google.com/bigquery/docs/reference/standard-sql/data-types
- https://whatagraph.com/blog/articles/bigquery-data-types
Timeline:
0:00 Giới thiệu
1:03 String types
2:15 Numeric types
2:25 Integer
3:58 Numeric & Float
6:21 Boolean types
9:54 Tổng kết
Hàm xử lý ký tự: https://cloud.google.com/bigquery/docs/reference/standard-sql/string_functions
Timeline:
0:00 Giới thiệu
1:04 Biến đổi in hoa
3:23 Nối ký tự
4:50 Làm sạch
8:03 Thay thế
9:54 Trích xuất
12:55 Tìm kiếm
13:57 Làm giàu
14:34 Tổng kết
Hàm xử lý số học: https://cloud.google.com/bigquery/docs/reference/standard-sql/mathematical_functions
Timeline:
0:00 Giới thiệu
0:26 Làm tròn
3:35 Toán học
Hàm xử lý boolean: https://cloud.google.com/bigquery/docs/reference/standard-sql/operators#is_operators
Timeline:
0:00 Phân tích yêu cầu
0:44 Cách 1: Loại bỏ
2:15 Cách 2: Trích xuất
Timeline:
0:00 Giới thiệu
0:29 CAST
5:57 PARSE_DATE
7:36 CASE WHEN
8:00 Tổng kết
Timeline:
0:00 Giới thiệu
1:03 Đổi tên
1:55 Đổi về đúng dạng
2:41 Xử lý dữ liệu sai
3:28 Xử lý null
4:25 Làm sạch giá trị
5:13 Làm giàu
6:19 Tổng kết
Timeline:
0:00 Giới thiệu
0:52 B1: Lưu kết quả làm sạch bằng giao diện Bigquery
3:15 Chia sẻ dataset cho public
4:43 B2: Lưu câu query làm sạch bằng giao diện Bigquery
5:47 Cách khác: Lưu query thành view
8:23 Cách khác: Lưu kết quả làm sạch bằng SQL
8:56 Tổng kết
Khóa Xử lý dữ liệu cho Data Warehouse: https://vitlamdata.substack.com/p/khoa-hoc-xu-ly-du-lieu-cho-data-warehouse
ĐA CON TRỎ (MULTI-CURSOR)
Thêm con trỏ ở dưới
Win: Ctrl+Alt+⬇️
Mac: Cmd+Alt+⬇️
Đi đến đầu/cuối dòng: Home/End
Đi hết một từ
Win: Ctrl+Arrow
Mac: Option+Arrow
Chọn hết một từ
Win: Ctrl+Shift+Arrow
Mac: Option+Shift+Arrow
Thêm con trỏ bằng cách tìm từ
Win: Ctrl+D
Mac: Cmd+D
Timeline:
0:00 Giới thiệu
0:59 Đổi tên cột
8:07 Đổi về đúng dạng | SELECT * EXCEPT
11:51 Bỏ dữ liệu sai
13:17 Làm giàu
14:15 Đa con trỏ (Multi-cursor)
18:10 Làm giàu (tiếp theo)
18:58 Sắp xếp cột và dữ liệu
21:44 Tổng kết
Timeline:
0:00 Giới thiệu
1:27 Đổi tên cột
8:34 Đổi về đúng dạng
10:49 Bỏ dữ liệu sai | SELECT DISTINCT
15:48 Xử lý null
19:35 Làm sạch giá trị
31:07 Sắp xếp dữ liệu & lưu bảng
32:53 Tổng kết
Timeline:
0:00 Giới thiệu
2:21 Kiểm tra duplicates
3:48 Date
5:31 Kiểm tra data được flatten
10:17 Tổng kết
Timeline:
0:00 Đổi tên cột
9:34 Đổi về đúng dạng
15:45 Làm sạch giá trị
17:19 Làm giàu Invoice Number
22:11 Làm giàu Company Name | Hàm SPLIT
33:20 Tổng kết
Timeline:
0:00 Giới thiệu dataset Hacker News
4:15 Data Profiling
Timeline:
0:00 Giới thiệu
3:03 Kiểm tra duplicates
3:33 Kiểm tra các cột
3:33 Dead
4:16 Timestamp
4:47 Type
5:48 Deleted
6:12 Kiểm tra business rules
8:58 Tổng kết
Timeline:
0:00 Đổi tên cột
9:33 Bỏ dữ liệu sai
18:04 Xử lý null
20:50 Lưu kết quả
Timeline:
0:00 Tách bảng story
5:18 Tách bảng comment
7:04 Tổng kết
Timeline:
0:00 Giới thiệu
0:27 Data Profiling
2:58 Data Quality
6:06 Làm sạch | Đổi tên
10:31 Đổi về đúng dạng
12:54 Làm giàu
14:29 Lượt views trung bình | Hàm DATE_DIFF
27:08 Lưu kết quả
Timeline:
0:00 Giới thiệu | Data Profiling
2:33 Làm sạch
6:37 Hàm TRIM
8:12 Làm sạch dấu cách | Dùng AI GPT (Google Bard)
11:49 Làm giàu | Trích xuất họ | Hàm SPLIT
13:54 Trích xuất tên
27:04 Lưu kết quả
27:31 Tìm hiểu dataset
Timeline:
0:00 Data Profiling
4:14 Phân tích yêu cầu
Timeline:
0:00 Union
4:53 Lưu ý khi dùng UNION ALL
8:47 Data shaping
Timeline:
0:00 Giới thiệu
0:59 Data Profiling
Timeline:
0:00 Kiểm tra duplicates
4:37 Đổi tên cột
9:35 Đổi về đúng dạng
11:01 Bỏ dữ liệu sai
14:22 Xử lý null
18:56 Làm sạch giá trị
20:58 Làm giàu | Hàm DATE_ADD
29:11 Lưu kết quả
Timeline:
0:00 Công việc thực tế
2:13 Cách tìm hiểu, nghiên cứu
3:24 Tại sao cần phân tích khách hàng (KH)?
6:28 Phân tích KH là gì?
12:32 Phân tích KH là làm gì?
20:29 Góc nhìn công việc thực tế
OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.
Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.
Find this site helpful? Tell a friend about us.
We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.
Your purchases help us maintain our catalog and keep our servers humming without ads.
Thank you for supporting OpenCourser.