Máy tínhCác loại tập tin

Định dạng CSV, hoặc nơi để đặt dấu phẩy?

Trong số các ứng dụng, phải đối mặt nếu không phải là một lập trình viên, nó đã là một người dùng cao cấp, nhập dữ liệu từ một ứng dụng khác không xảy ra rất hiếm. Và khá thường xuyên nó là cần thiết để nhập dữ liệu dạng bảng, trong đó, trên thực tế, được đặt ra bởi định dạng CSV. Người đã phát triển một số giải pháp thay thế (lãnh đạo XML trong số đó). Nhưng việc tạo ra các tập tin CSV, trong một số trường hợp, sự là giải pháp thuận tiện nhất, và một số - vấn đề nhất.

Nó tượng trưng cho tên của định dạng như một commaseparatedvalues - giá trị bằng dấu phẩy. Trong tập tin Notepad như sau:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (ở phần cuối của một dấu hiệu đặt không bắt buộc)

Và trong một bảng tính hoặc tương tự ứng dụng Excel đã vậy:

00 01 02 03
01 15 34 11
16 27 33 06

Nhưng bây giờ chúng tôi đã thảo luận về trường hợp đơn giản nhất. Vấn đề bắt đầu chỉ vì thực tế là do báo cáo dữ liệu rất nén, định dạng CSV được sử dụng để chuyển một lượng lớn thông tin. thường xuyên nhất được tìm thấy trong cơ sở dữ liệu của các giá trị đa dạng: số, alpha, chữ và số, với không gian vv Thông thường trong mảng lớn là sai lầm, và nếu, ví dụ, ở đâu đó sẽ là một dấu phẩy trong các nội dung của một trong những lĩnh vực, tất cả các tế bào có thể được thay thế bằng một.

Nói chung, các vấn đề phát sinh khi dữ liệu được nhập khẩu thông qua các định dạng tập tin CSV, có thể được chia thành ba loại:

1 - lĩnh vực điền không đúng.

2 - Không đúng dữ liệu chuyển đổi khi lưu vào tập tin CSV.

3 - nhận không đúng định dạng chương trình nhập khẩu.

Trường hợp đầu tiên, chúng tôi đã kiểm tra một phần. Để giải quyết vấn đề, bạn phải cung cấp một phương tiện để giám sát tính chính xác của dữ liệu nhập vào. Ví dụ, nếu bạn cần phải thu thập cơ sở dữ liệu địa chỉ cho danh sách gửi thư, có những kịch bản đặc biệt mà xác minh xem một người đã bước vào e-mail ở dạng thích hợp. Trong trường hợp có những khoảng trống, dấu phẩy, và bất kỳ dữ liệu khác có thể được đọc sai, nội dung của lĩnh vực này phải được đặt trong dấu ngoặc kép (cái gọi là máy tính "").

Trường hợp thứ hai được kết nối với sự lựa chọn của mã hóa. Cần phải tìm hiểu thường trải qua những gì mã hóa thích chương trình nhập khẩu. Trong Windows thường được sử dụng trong năm 1251, vì vậy nếu các tập tin gốc sẽ đáp ứng được các văn bản sang Unicode, hãy làm theo nó sẽ được hiển thị trong ứng dụng đích như một chuỗi các câu hỏi. Trong Excel, bạn có thể lưu ở định dạng CSV với mã hóa khác nhau và delimiter (trừ điểm vẫn trong tab sử dụng, và dấu chấm phẩy), nhưng nó là tốt nhất để tạo ra một tập tin trong Notepad ++ hoặc OpenOffice.org Calc.

Trường hợp thứ ba - một hệ quả của thứ hai. Về mặt lịch sử, định dạng CSV không có một tiêu chuẩn duy nhất. Nhiều chương trình được coi là CSV và file TSV (tab-delimited) và SCSV (cách nhau bằng dấu chấm phẩy), đặc biệt là bởi vì phần mở rộng tập tin không được báo cáo về nó. Trong trường hợp này, dữ liệu được đọc không chính xác và không được phân bổ giữa các tế bào theo đúng thứ tự. Điều tốt nhất chúng tôi có thể tư vấn - để tạo ra một tập tin CSV cá nhân. Như đã đề cập, nó cần phải tận dụng một trình soạn thảo thuận tiện.

Tricks làm thế nào để chế ngự các định dạng CSV, các lập trình viên nổi tiếng. người dùng đơn giản cần phải tuân theo các khuyến nghị của chúng tôi để tạo ra một tập tin. Nhất của tất cả các vấn đề xảy ra khi tập tin được tạo ra đặc biệt cho việc nhập khẩu vào một ứng dụng cụ thể (và đôi khi theo một cách khác). Nó dễ dàng hơn để đưa vào tài khoản tất cả các vấn đề có thể gặp phải trong dữ liệu.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 vi.atomiyme.com. Theme powered by WordPress.