Khi làm việc trên phần mềm Excel sẽ có nhiều lúc bạn gặp trường hợp bị trùng do lỗi nhập dữ liệu và làm cho số liệu bị sai lệch. Làm cách nào để khắc phục lỗi đó? Thông qua bài viết này, Mua Bán sẽ mách bạn 5 cách lọc dữ liệu trùng trong Excel một cách hiệu quả và đơn giản nhất. Mời bạn đọc theo dõi ngay.
I. Các cách lọc dữ liệu trùng trong Excel cực đơn giản
Dưới đây là hướng dẫn cách lọc dữ liệu trùng trong Excel nhanh – gọn – lẹ nhất. Cụ thể:
1. Cách lọc dữ liệu trùng trong Excel bằng công cụ Remove Duplicate
Trong Microsoft Excel, có một tính năng hữu ích gọi là “Remove Duplicates” giúp người dùng dễ dàng loại bỏ các dòng dữ liệu trùng lặp mà không cần phải quan tâm đến nội dung bên trong. Điều đáng chú ý là tính năng này đã được tích hợp sẵn từ những phiên bản Excel cách đây rất lâu. Dưới đây là cách đơn giản nhất để lọc dữ liệu trùng lặp bằng tính năng Remove Duplicates:
Bước 1: Truy cập File Excel mà bạn cần lọc dữ liệu -> Bôi đen toàn bộ vùng dữ liệu cần lọc.
Bước 2: Chọn thẻ Data -> Tiếp tục chọn Data Tools -> Nhấp vào hộp thoại Remove Duplicates -> Cuối cùng là chọn Expand the selection. Trong hộp thoại này sẽ có 2 sự lựa chọn cho bạn:
- Trường hợp 1: Dòng đầu tiên của vùng dữ liệu sở hữu dòng đầu tiên là tên của cột thì bạn nên chọn vào “My data has headers”.
- Trường hợp 2: Nếu bạn có nhu cầu chọn lọc dữ liệu bị trùng trên tất cả vùng dữ liệu đã chọn thì bạn nhấp chọn “Select All”.
Bước 3: Nhấn xác nhận “OK”. Sau đó, hệ thống sẽ trả về cho bạn một thông báo về số giá trị bị trùng (gọi là duplicate values) đã được thao tác xóa đi và để lại duy nhất 1 số giá trị (gọi là unique values) còn lại trong vùng dữ liệu mà bạn đã quét.
Đây được xem là cách lọc dữ liệu trùng trong Excel được dùng trong hầu hết các phiên bản từ 2003 đến 2016 của phần mềm Excel và được các chuyên gia về công nghệ thông tin đánh giá là hiệu quả và dễ thao tác nhất.
Xem thêm: Cách cố định cột trong Excel cực đơn giản và chi tiết
2. Cách lọc dữ liệu trùng trong Excel bằng tính năng Conditional Formatting
Khi bạn không chắc chắn về dữ liệu của mình và muốn kiểm tra trước khi quyết định xóa, tính năng “Conditional Formatting” (Định dạng có điều kiện) trong Excel là một lựa chọn hợp lý để đánh dấu các dữ liệu trùng lặp. Cách lọc dữ liệu trùng trong Excel này bao gồm có 3 bước và dưới đây là cách sử dụng tính năng này:
Bước 1: Chọn ngay cột dữ liệu mà bạn đang có nhu cầu kiểm tra (Chọn phạm vi dữ liệu mà bạn muốn kiểm tra các dòng trùng lặp. Bạn có thể chọn một cột hoặc nhiều cột dữ liệu cùng lúc) -> Chọn thẻ Home -> Nhấp chọn Styles và nhấn vào nút “Conditional Formatting” -> Tìm và chọn tiếp Highlight Cells Rules -> Cuối cùng là chọn hộp thoại Duplicate Values.
Bước 2: Lúc này, bạn được phép lựa chọn việc nổi bật giá trị vùng lặp bằng thao tác chọn Duplicate ở ô đầu tiên (trường hợp nếu bạn muốn làm nổi bật giá trị duy nhất ở vùng dữ liệu này), hãy thao tác sửa lại ô này thành Unique.
Kể từ ô trùng lập thứ 2 thì bạn có thể chọn màu sắc bất kỳ để có thể dễ dàng xác định. Ở đây Mua Bán sẽ dùng ô màu đỏ nhạt và chữ có màu đỏ đậm (Tên đầy đủ đó là Light Red Fill with Dark Red Text)
Bước 3: Xác nhận bằng thao tác nhấp OK và bạn sẽ thấy rằng các dữ liệu bị trùng lặp (nếu bạn đã nhấn chọn Duplicate) hoặc các dữ liệu Unique sẽ được đánh dấu theo màu sắc mà bạn đã quy định trước đó.
Xem thêm: 6 cách đánh số trang trong Excel 2003, 2007, 2010, 2016 đơn giản, nhanh chóng nhất
3. Cách lọc dữ liệu trùng trong Excel bằng với Advanced Filter
Tính năng Advanced Filter hoạt động tương tự như một bộ lọc thông thường, cho phép người dùng chỉ lọc ra các giá trị mà họ quan tâm, trong khi các giá trị còn lại vẫn được giữ nguyên và không bị mất đi. Để có thể thực hiện được cách lọc dữ diệu bị trùng trong Excel thông qua Advanced Filter thì người dùng cần phải thực hiện các bước sau đây:
Bước 1: Kéo và chọn vào vùng dữ liệu mà bạn đang muốn kiểm tra -> Nhấp chọn thẻ Data -> Tìm tại nhóm Soft & Filter -> Chọn lệnh Advanced.
Bước 2: Trong đây sẽ có một vài yêu cầu đòi hỏi người dùng phải thiết lập, bao gồm có:
- Mục Action: Bạn có thể chọn “Filter the list, in-place” nếu bạn muốn lọc thông thường. Excel sẽ lọc các dòng dữ liệu theo điều kiện lọc đã được xác định hoặc bạn có thể chọn “Copy to another location” nếu bạn chỉ muốn sao chép các giá trị đã lọc sang một vị trí khác trong bảng tính.
- Mục List range (Phạm vi về danh sách): Đây là nơi bạn chỉ định vùng dữ liệu bạn muốn lọc. Đảm bảo rằng phạm vi này bao gồm tất cả các dòng và cột của bảng dữ liệu cần lọc.
- Mục Criteria range (Phạm vi về tiêu chí): Nơi bạn cần phải định nghĩa các điều kiện lọc. Các tiêu chí được áp dụng cho các cột tương ứng trong phạm vi danh sách.
- Mục Copy to (Sao chép đến): Mục này chỉ hiển thị khi bạn chọn “Copy to another location” ở mục Action. Bạn cần chọn vị trí trong bảng tính mà bạn muốn sao chép dữ liệu đã lọc đến.
- Mục Unique records only (Chỉ giữ lại giá trị duy nhất): Đây là tùy chọn quan trọng để lọc ra các giá trị duy nhất trong bảng dữ liệu. Nhấn chọn vào ô này, bạn chỉ giữ lại các giá trị duy nhất sau quá trình lọc.
Bước 3: Nhấp chọn vào nút OK và bạn đã hoàn tất.
Tham khảo tin đăng mua bán latop, máy tính cũ giá rẻ tại website Muaban.net dưới đây: |
4. Cách lọc dữ liệu trùng trong Excel bằng công cụ PivotTable
Ngoài ba cách kể trên thì còn thêm một cách lọc dữ liệu trùng trong Excel đó là bằng công cụ PivotTable. Bạn cần phải làm lần lượt theo các bước sau:
Bước 1: Chọn vùng dữ liệu -> Chọn thẻ Insert -> Chọn lệnh PivotTable. Tiếp tới kiểm tra lại Table/Range có đang đúng vùng dữ liệu hoặc bảng mà bạn đang dự định tạo hay không. Ở mục “Choose where you want the PivotTable to be placed” thì bạn nhấp chọn vào New Worksheet (trường hợp bạn muốn xuất hiện ở trang mới hoàn toàn) hay chọn Existing Worksheet (trường hợp bạn muốn đặt ở một vị trí nhất đinh nào đó cụ thể). Sau đó nhấp OK.
Ngoài ra, bạn có thể tạo bảng rồi sau đó dùng PivotTable bằng việc chọn vào vùng dữ liệu -> Chọn thẻ Insert -> Chọn vào Table (hoặc dùng tổ hợp phím Ctrl +T) Sau đó thì vào “My table has Headers” và nhấp ngay vào OK.
Bước 2: Các tùy chọn liên quan đến PivotTable sẽ hiện ra. Bạn sẽ tìm cửa sổ PivotTable Fields, hãy tích vào thông tin mà bạn đang muốn kiểm tra dữ liệu trùng vào ô Rows (ở ví dụ dưới đây thì cột lọc sẽ là cột Họ và Tên). Tiếp đến, nhấp chuột phải và chọn đó đến ô Values
Tại thời điểm này, PivotTable sẽ bắt đầu thao tác đếm số lần hiện diện của mỗi giá trị trong cột mà bạn đã chỉ định và những giá trị nào có số lượng lớn hơn 1 thì được xem là giá trị đã bị trùng lặp.
Bước 3: Nhấp liên tục 2 cái vào các giá trị đang lớn hơn 1, ở đây ví dụ là có 3 dữ liệu “Nguyễn Văn A”, lúc này thì Excel sẽ hiển thị các giá trị đã bị trùng lặp cho bạn.
Đây là cách lọc dữ liệu trùng trong Excel có phần phức tạp nhất (xét trường hợp dùng các câu lệnh), nên nếu bạn không am hiểu quá nhiều về phầm mềm này thì bạn có thể lựa chọn các cách trên để dễ dàng thực hiện và theo dõi hơn.
Xem thêm: 3 cách tạo bảng trong Excel dễ làm và cực hiệu quả
5. Cách lọc dữ liệu trùng trong Excel bằng công thức
Tuy nhiên mặt trái của 4 cách lọc dữ liệu trùng trong Excel nêu trên chỉ có thể dùng ở trong cùng 1 sheet. Vì thế nếu muốn sử dụng trên nhiều sheet làm việc thì bạn cần phải dùng đến các hàm trong Excel. Để có thể tìm thấy những giá trị trùng lặp thì bạn phải trải qua 3 bước sau:
Bước 1: Ở cột D thêm vào chữ “Kiểm tra” vào vùng dữ liệu thứ 2.
Bước 2: Quan sát kỹ và nhập dòng công thức cho cột “Kiểm tra” tại ô D2:
=IF(ISNA(VLOOKUP(A2,SHEET1!A:C,1,0)),”Unique”,”Duplicate”)
Bước 3: Thao tác công thức cho toàn bộ cột D (Kiểm tra). Những giá trị không bị trùng lặp hay gọi tên khác là giá trị duy nhất thì sẽ được trả về “Unique” và ngược lại.
Theo các chuyên gia về công nghệ thông tin, khi sử dụng hàm như một công cụ hay cách lọc dữ liệu trùng trong Excel, người dùng sẽ dễ thao tác mà không cần quá nhiều sự hiểu biết về các công cụ trên thanh Tools của phần mềm Excel.
II. Vì sao nên sử dụng các công cụ lọc trùng dữ liệu trong Excel?
Có 5 lợi ích khi bạn sử dụng một trong các cách lọc dữ liệu trùng trong Excel, đó là:
- Loại bỏ dữ liệu trùng lặp: Các công cụ lọc trùng dữ liệu giúp bạn dễ dàng xác định và loại bỏ các giá trị trùng lặp trong tập tin của bạn. Điều này giúp tăng tính chính xác và sắp xếp dữ liệu một cách hiệu quả, tránh sự trùng lặp không cần thiết.
- Giảm lỗi và sai sót: Dữ liệu trùng lặp có thể dẫn đến các lỗi sai trong quá trình phân tích và xử lý dữ liệu. Bằng cách sử dụng công cụ lọc trùng dữ liệu, bạn có thể loại bỏ các giá trị trùng lặp và đảm bảo rằng bạn đang thao tác với dữ liệu duy nhất và chính xác nhất.
- Tiết kiệm thời gian và công sức: Thay vì phải thực hiện bằng phương pháp thủ công tìm kiếm và loại bỏ dữ liệu trùng lặp, các công cụ lọc trùng dữ liệu trong Excel giúp tiết kiệm thời gian và tăng hiệu suất của bạn chỉ cần một vài bước đơn giản.
- Phân tích dữ liệu: Bằng cách loại bỏ dữ liệu trùng lặp, bạn có thể tạo ra các báo cáo và phân tích dữ liệu chính xác hơn. Dữ liệu không bị trùng lặp giúp bạn đưa ra quyết định và khám phá thông tin quan trọng một cách dễ dàng và đáng tin cậy.
- Dễ dàng xác định dữ liệu duy nhất: Sử dụng các công cụ lọc trùng dữ liệu, bạn có thể tìm ra các giá trị duy nhất trong tập tin Excel của bạn. Điều này hữu ích khi bạn cần phân loại, phân đoạn hoặc làm việc với các tập hợp dữ liệu không trùng lặp.
Video hướng dẫn cụ thể:
Lời kết
Bài viết đã giới thiệu đến quý bạn đọc chi tiết nhất về nội dung hướng dẫn các cách lọc dữ liệu trùng trong Excel. Hy vọng bạn đọc đã có thể hiểu và bỏ túi cho mình thêm một kiến thức hữu ích trong mẹo văn phòng mà Mua Bán đã chia sẻ đến bạn.
Nếu bạn đang cần một công việc nói chung hay việc làm kế toán nói riêng nhưng chưa có cơ hội biết đến nhiều nơi uy tín thì hãy truy cập ngay Muaban.net – trang tin rao vặt uy tín nhất hiện nay để tham khảo thêm nhé.
Xem thêm:
- [Video] Cách dùng hàm HLOOKUP trong Excel kèm ví dụ dễ hiểu
- Hướng dẫn cách đánh dấu chấm trong Word nhanh chóng và đơn giản
- Hướng dẫn chi tiết cách tính hàm Sum trong Excel hiệu quả