SQL là gì? Tại sao nên sử dụng SQL thay vì Excel?
Các ứng dụng bảng tính có thể dễ tiếp cận, có mặt khắp nơi và linh hoạt. Chúng có thể hợp nhất các ô, thêm nhận xét, xoay vòng dữ liệu, định dạng bảng và tạo biểu đồ. Nhưng với sự linh hoạt đi kèm rủi ro. Chúng có thể dẫn đến nhiều công việc hơn, chờ đợi nhiều hơn, phức tạp với nhiều phiên bản và độ chính xác thấp hơn. May mắn thay, SQL có thể nhanh hơn, dễ dàng hơn và an toàn hơn Excel. Đọc tiếp để tìm hiểu SQL là gì? và để biết lý do tại sao đó là cách tốt hơn để thao tác và phân tích dữ liệu.
Nếu bạn đang sử dụng các ứng dụng bảng tính như Excel hoặc Google Sheets tại nơi làm việc, chắc hẳn đây là những vấn đề quen thuộc :
- Rất dễ vô tình nhập sai làm thay đổi thông tin dữ liệu
- Thật khó để sao chép một phân tích cũ về dữ liệu mới (rất nhiều bước cần nhớ!)
- Khi phải xử lý với bộ dữ liệu lớn nó thường bị chậm
- Khá khó khăn để chia sẻ bảng tính khổng lồ qua email.
Excel chuyển sang dùng SQL: Tại sao không?
Nhược điểm của Excel
Trước khi tìm hiểu SQL là gì? chúng ta hãy bắt đầu với một ví dụ thực tế. Bạn có 1 bảng danh sách các Pokémon với đặc điểm của chúng:
Tên | Hệ | Cân nặng |
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
Giả sử rằng chúng ta muốn sử dụng Excel để lọc bỏ mọi thứ trừ “Tên” và “Hệ”của mọi Pokémon loại “Grass” trong bảng. Trong Excel, chúng ta phải sử dụng các hướng dẫn từng bước để lấy dữ liệu:
- Mở bảng Pokémon
- Thêm bộ lọc vào cột "Hệ"
- Bộ lọc cho loại = "Grass"
- Xóa tất cả các cột ngoại trừ "Tên"
Đến đây, chúng ta đã chỉnh sửa dữ liệu > dễ gây ra lỗi tiềm ẩn, chúng ta không có bản sao các bước được lưu ở bất cứ đâu (khó sao chép) và chúng ta sẽ cần gửi email toàn bộ tệp cho các huấn luyện viên Pokémon (một phiên bản khó điều khiển và kiểm soát).
Khi bảng Pokémon tăng số lượng các dữ liệu, Excel, hoặc Google Sheets sẽ bị chậm lại. Nếu số lượng là hàng ngàn, nó thực sự có thể làm hỏng quy trình làm việc. Nếu bạn đã từng bị mắc kẹt khi nhìn chằm chằm vào một "Pinwheel of Death" hoặc một tin nhắn "Excel quit unexpectedly", bạn sẽ thấu nỗi đau này.
SQL là gì?
SQL chỉ là một ngôn ngữ được sử dụng trong lập trình. Khi chúng ta nói "sử dụng SQL", thì có nghĩa là:
- Dữ liệu của bạn được lưu trữ trong cơ sở dữ liệu liên kết, được tạo thành từ các bảng. Các bảng đó thường trông giống như một trang tính trong Excel, với các hàng và cột.
- Bạn lấy dữ liệu và thực hiện phân tích với các truy vấn, đó là một bộ hướng dẫn được viết bằng SQL. Bạn có thể lưu chúng giống như cách bạn lưu tệp văn bản.
- Thay vì mô tả cách lấy dữ liệu như trong Excel hoặc Sheets, các truy vấn của bạn mô tả dữ liệu bạn muốn thì bạn có thể chạy các truy vấn này với trình thông dịch SQL, thực hiện các bước phân tích và truy xuất cần thiết cho bạn.
Excel chuyển sang dùng SQL: Tại sao không?
SQL nhanh hơn nhiều so với Excel. Có thể mất vài phút trong SQL để thực hiện những gì phải mất gần một giờ để làm trong Excel. Về mặt kỹ thuật, Excel có thể xử lý một triệu hàng, nhưng đó là trước các bảng trụ, nhiều tab và các chức năng mà bạn có thể đang sử dụng.
SQL cũng tách phân tích khỏi dữ liệu. Khi sử dụng SQL, dữ liệu của bạn được lưu trữ tách biệt khỏi phân tích của bạn. Thay vì gửi email một tệp Excel lớn, bạn có thể gửi các tệp văn bản đơn giản nhỏ chứa các hướng dẫn cho phân tích của bạn. Mỗi thành viên trong nhóm có quyền truy cập vào cùng một dữ liệu, vì vậy họ có thể tự mình phân tích. Họ không phải quản lý các phiên bản tệp hoặc có nguy cơ làm hỏng dữ liệu và họ có thể chạy lại nó trên bất kỳ dữ liệu nào khác.
Tất cả những điều này nằm trong các yêu cầu nghiêm ngặt của nhà tuyển dụng đối với nhân viên IT của mình cho các kỹ năng SQL, chứ không đơn giản chỉ hỏi bạn xem SQL là gì?
Làm thế nào để truy vấn công việc (Queries Work)?
Nhìn lại lần nữa ví dụ trên nhé?
Tên | Hệ | Cân nặng |
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
Với SQL, chúng ta có thể viết các truy vấn để khai báo chính xác những gì chúng ta muốn từ dữ liệu. Ví dụ:
Truy vấn này cho biết "Tôi muốn Tên và Hệ của mọi Pokémon trong bảng pokemon là loại 'Grass'."
Bảng kết quả của chúng ta sẽ trông như thế này:
Tên | Hệ |
bulbasaur | Grass |
oddish | Grass |
Giải nghĩa Query này:
- SELECT là từ khóa yêu cầu SQL bắt đầu truy vấn
- Tên và Hệ là các cột trong bảng pokemon
- FROM là từ khóa cho biết truy vấn để xem bảng pokemon
- WHERE lọc dữ liệu của chúng tôi trong các điều kiện được chỉ định
So sánh điều này với công việc tương đương trong Excel. Thay vì thực hiện một loạt các bước dễ bị lỗi, chậm thực thi, khó nhân rộng và khó chia sẻ, các truy vấn SQL có thể nhanh hơn, dễ dàng hơn và an toàn hơn.
Ta vẫn có thể sử dụng các công thức trong SQL chứ?
Nếu bạn chưa biết SQL là gì? Và là người dùng thân thiết của Excel, bạn có thể do dự khi phải từ bỏ các công thức quen thuộc như thế này:
Từ khaHoặc thế này:
SQL cung cấp cùng chức năng, với khả năng đọc cao hơn, nhờ cú pháp có cấu trúc và giống tiếng Anh. SUM được sử dụng để thêm nhiều giá trị và CASE được sử dụng để xử lý các logic có điều kiện. Ví dụ:
Hay:
Dựa trên cơ sở khái niệm SQL là gì, ta có câu lệnh đầu tiên trả về tổng của tất cả các trọng số trong bảng pokemon. Câu lệnh thứ hai trả về hai cột: tên của mỗi Pokémon và nhãn kích thước ("small" nếu dưới 5, "medium" nếu dưới 15, v.v.). Lưu ý rằng SQL sử dụng các tên cột cụ thể thay vì các tham chiếu ô trừu tượng và các từ như WHEN và THEN thay vì dấu ngoặc đơn và dấu phẩy.
Bạn cũng có thể sử dụng các bảng trụ (Pivos Tables). Điều gì làm bạn mất bảy lần nhấp trong Excel sẽ đưa bạn bảy lần nhấn phím trong SQL, chỉ cần gõ GROUP BY:
Truy vấn này sẽ trả về tổng trọng lượng của tất cả các Pokémon thuộc từng Hệ:
Tên | Hệ |
grass | 27 |
fire | 19 |
water | 20 |
electric | 13 |
normal | 1014 |
psychic | 269 |
Câu lệnh SQL này ngắn gọn và cụ thể hơn danh sách các hướng dẫn bạn sẽ cần để mô tả cùng một trục trong Excel và câu lệnh SQL có thể được chạy trên nhiều bộ dữ liệu với ít công suất hơn. Nói cách khác, câu lệnh SQL rất đơn giản, dễ hiểu và dễ dàng chuyển đổi.
Kết luận
Các ứng dụng bảng tính như Sheets và Excel rất phù hợp để trình bày, vẽ đồ thị và phân tích nhỏ, nhưng chúng có thể không đủ cho các tác vụ đòi hỏi với số lượng lớn và phức tạp hơn. SQL có thể hoàn thành hầu hết các tác vụ đó nhanh hơn và thân thiện với người dùng hơn từ đầu đến cuối.
Giờ đây chắc hẳn bạn đã biết SQL là gì và các lý do cũng như những dẫn chứng trên đã đủ thuyết phục bạn sử dụng SQL thay vì Excel cho các dữ liệu của mình!
Gợi ý tìm việc!
Bạn đã sẵn sàng để học các ngôn ngữ và thực hành với dữ liệu thực. Khi bạn tìm hiểu và cải thiện với SQL, bạn sẽ có thể chuyển nhiều khối lượng công việc của mình từ Excel sang SQL, đặt Excel làm giai đoạn cuối để tạo các bảng và biểu đồ trực quan hấp dẫn. GrowUpWork chúc bạn thành công!
Tin tức liên quan
Lộ trình học Java Developer dành cho mọi lứa tuổi
Tương lai ngành lập trình game liệu còn đủ tốt để theo đuổi?
Phân biệt nghề nghiệp: AI Developer và AI Engineer
Machine Learning Engineer Là Gì? Tiềm năng và thách thức của ML Engineer