Máy tínhSự an toàn

Hệ thống này ... dấu - Encoding: thông tin mã hóa

Mã hóa thông tin - một lĩnh vực vô cùng rộng kiến thức. Tất nhiên, nó được liên kết trực tiếp với sự phát triển của công nghệ kỹ thuật số. Nhiều trường học hiện đại là chủ đề phổ biến nhất - thông tin mã hóa. Hôm nay chúng ta sẽ tìm hiểu những giải thích cơ bản của hiện tượng này liên quan đến các khía cạnh khác nhau của máy tính. Chúng tôi sẽ cố gắng trả lời câu hỏi: "? Encoding - quá trình, phương pháp, công cụ hoặc tất cả những điều này cùng một lúc"

Zeros và những người

Hầu như bất kỳ loại dữ liệu sẽ được hiển thị trên một màn hình máy tính, cách này hay cách khác đại diện cho một mã nhị phân gồm số không và những người thân. Đó là dễ dàng nhất, "cấp thấp" cách để mã hóa dữ liệu, cho phép các máy tính để xử lý dữ liệu. mã nhị phân là phổ quát: nó được hiểu bởi tất cả, không có ngoại lệ, máy vi tính (trên thực tế, đó là lý do tại sao nó được tạo ra - để chuẩn hóa việc sử dụng các thông tin dưới dạng kỹ thuật số).

Các đơn vị cơ sở, trong đó sử dụng một bảng mã nhị phân - đó là một chút (từ chữ "nhị phân chữ số" - "hai con số"). Nó là bằng 0 hoặc 1. Nói chung, riêng các bit không được sử dụng và kết hợp trong một chuỗi 8 chữ số - byte. Trong mỗi trong số họ, do đó, có thể chứa đến 256 kết hợp các zeros và những người (2 với sức mạnh thứ 8). Để ghi lại một lượng đáng kể các thông tin được sử dụng, byte thường không bị cô lập, và giá trị lớn hơn - với tiền tố "kg", "mega" "giga", "Tera", vv, mỗi trong số đó là lớn hơn trước 1.000 lần .. .

văn bản mã hóa

Loại phổ biến nhất của dữ liệu kỹ thuật số - một văn bản. Làm thế nào là nó mã hóa? Thật dễ dàng đủ quá trình giải thích được. Bức thư, dấu chấm câu, số hoặc biểu tượng có thể được mã hóa bởi một hoặc nhiều byte, có nghĩa là, các máy tính nhìn thấy chúng như là một chuỗi duy nhất của số không và những người thân, và sau đó, phù hợp với các thuật toán phát hiện nằm xuống được hiển thị. Có hai chính trên thế giới chuẩn "mã hóa" máy tính văn bản - ASCII và UNICODE.

Hệ thống ASCII, mỗi ký tự được mã hóa bởi chỉ một byte duy nhất. Nghĩa là, theo tiêu chuẩn này, bạn có thể "mã hóa" để 256 ký tự - đó là quá đủ để hiển thị những biểu tượng của phần lớn các bảng chữ cái trên thế giới. Tất nhiên, tất cả các hệ thống thư quốc gia hiện nay không phù hợp với khu vực này. Do đó, đối với mỗi chữ cái được tạo ra riêng "hệ thống phụ" mã hóa của nó. Nó sẽ thông tin mã hóa sử dụng hệ thống ký hiệu, phù hợp với mẫu quốc gia về văn bản. Tuy nhiên, mỗi người trong số các hệ thống này, đến lượt nó, là một phần của một tiêu chuẩn ASCII toàn cầu thông qua quốc tế.

Là một phần của hệ thống ASCII, đây là tài nguyên của 256 nhân vật được chia thành hai phần. Đầu tiên 128 - là những biểu tượng dành cho bảng chữ cái tiếng Anh (từ a đến z), cũng như con số, dấu chấm câu cơ bản và một số nhân vật khác. Thứ hai 128 byte được dành riêng, đến lượt nó, theo hệ thống thư quốc gia. Đây là "tiểu hệ thống" cho bảng chữ cái không phải tiếng Anh - Nga, Tiếng Hin-ddi, tiếng Ả Rập, Nhật Bản, Trung Quốc và nhiều người khác.

Mỗi trong số họ được thể hiện dưới dạng bảng mã hóa riêng biệt. Nghĩa là, nó có thể xảy ra (và thường nó sẽ xảy ra), vì vậy mà cùng một chuỗi các bit sẽ chịu trách nhiệm về chữ cái và biểu tượng trong hai bảng 'quốc gia' riêng biệt khác nhau. Hơn nữa, do đặc thù của sự phát triển của CNTT-cầu ở các nước khác nhau, thậm chí họ là khác nhau. Ví dụ, đối với tiếng Nga hai hệ thống mã hóa phổ biến nhất: Windows-1251 và KOI-8. Đầu tiên xuất hiện sau này (cũng như giai điệu của riêng mình với hệ điều hành), nhưng bây giờ nhiều CNTT-chuyên gia sử dụng trên cơ sở ưu tiên. Do đó, các máy tính mà nó có thể được đảm bảo để đọc văn bản tiếng Nga nên có thể xác định một cách chính xác cả hai bảng. Nhưng như một quy luật, không có vấn đề với nó (nếu hệ điều hành máy tính hiện đại cần thiết).

Văn bản Encoding Phương pháp cải thiện tất cả các thời gian. Ngoài "single-byte" Hệ thống ASCII có thể xử lý chỉ 256 giá trị cho các nhân vật, đó cũng là một "double-byte" hệ thống UNICODE. Nó rất dễ dàng để tính toán nó cho phép mã hóa văn bản trong một số tiền bằng 2 với mức độ 16, tức là 65.000. 536. Trong đó, đến lượt nó, có các nguồn lực để đồng thời mã hóa hầu như tất cả các bảng chữ cái quốc gia đang tồn tại trên thế giới. Sử dụng UNICODE là không ít phổ biến hơn so với sự tham gia của các tiêu chuẩn ASCII "cổ điển".

mã hóa bảng xếp hạng

Chúng tôi đã xác định như thế nào dòng chữ "mã hóa" và trong trường hợp này các byte đã qua sử dụng. Như là trường hợp với hình ảnh kỹ thuật số và hình ảnh? Nó cũng khá đơn giản. Cách giống như nó xảy ra với các văn bản, vai trò chính trong mã của đồ họa máy tính chơi tất cả các byte tương tự.

Quá trình chụp ảnh kỹ thuật số nói chung là tương tự như cơ chế mà qua đó chạy TV. Trên màn hình TV, nếu chúng ta nhìn, hình ảnh bao gồm một đa số pixel riêng lẻ mà tạo chung một nguyên hình dạng ở mắt xa. ma trận truyền hình (hoặc máy chiếu CRT) của máy phát nhận được tọa độ theo chiều ngang và dọc của mỗi điểm và hình ảnh dần dần xây dựng. đồ họa máy tính mã hóa nguyên tắc hoạt động theo cách tương tự. "Mã hóa" byte của hình ảnh dựa trên sự phân công của mỗi người trong số các dấu chấm màn hình tọa độ tương ứng (và màu sắc của mỗi người trong số họ). Nó thuật ngữ đơn giản. Tất nhiên, đồ họa mã hóa - quá trình này là phức tạp hơn nhiều so với các văn bản tương tự.

Phương pháp tương ứng tham khảo điểm toạ độ và các thông số màu sắc được gọi là "bitmap". Tương tự như vậy, tên của nhiều định dạng tập tin đồ họa máy tính. Các tọa độ của mỗi điểm ảnh và màu sắc của họ được ghi lại trong một hoặc nhiều byte. số quyết định gì? Chủ yếu vào có bao nhiêu sắc thái của màu sắc sẽ "mã hóa". Một byte được biết đến - là 256 giá trị. Nếu chúng ta có đủ hình ảnh của tòa nhà như một số lượng lớn các màu - chúng tôi sẽ quản lý khu vực này. Đặc biệt, sở hữu của chúng tôi có thể 256 sắc thái của màu xám. Và đây sẽ là đủ để mã hóa hầu như bất kỳ hình ảnh màu đen và trắng. Đổi lại, những hình ảnh màu sắc của tài nguyên là không đủ: mắt người, như bạn đã biết, có khả năng phân biệt lên đến vài chục triệu màu. Do đó nhu cầu "khẩn cấp" không phải là 256 giá trị, và trong hàng trăm ngàn lần trở lên. Tại sao được kích hoạt để mã hóa điểm không phải là một byte, nhưng nhiều: hôm nay trên các tiêu chuẩn hiện hành, có thể có 16 (có thể "mã hóa" 65 K 536 màu sắc.) Hoặc 24 (777,000-16.000.000 216 màu.).

Không giống như các tiêu chuẩn văn bản, sự đa dạng trong đó có thể so sánh với số lượng ngôn ngữ trên thế giới, với một bản vẽ điều một chút dễ dàng hơn. Các định dạng tập tin phổ biến nhất (chẳng hạn như JPEG, PNG, BMP, GIF, và vân vân. D.) đang được công nhận trên hầu hết các máy tính nói chung tốt như nhau.

Không có gì phức tạp để hiểu được mã hóa được thực hiện đối với một số nguyên tắc là thông tin đồ họa. Lớp 9 bất kỳ trường Nga trung bình thường bao gồm các khóa học về khoa học máy tính, nơi mà công nghệ như được trình bày trong một số chi tiết rất đơn giản và ngôn ngữ dễ hiểu. Ngoài ra còn có các chương trình đào tạo chuyên ngành cho người lớn - họ là tổ chức các trường đại học, trường trung học, hay còn đi học.

Do đó, người đàn ông Nga hiện đại là nơi để có được kiến thức về các mã có ý nghĩa thiết thực về mặt đồ họa máy tính. Và nếu bạn muốn làm quen với những kiến thức cơ bản, bạn có thể nhận được các tài liệu đào tạo có sẵn. Đối với những bao gồm, ví dụ, chương "Mã hóa thông tin đồ họa (9 cấp sách giáo khoa" Tin học và công nghệ thông tin "giả Ugrinovich ND).

Mã hóa dữ liệu âm thanh

Máy tính thường xuyên sử dụng để nghe nhạc và các tập tin âm thanh khác. Cũng giống như là trường hợp với văn bản và đồ họa, bất kỳ âm thanh trên máy tính của bạn - đó là tất cả các byte tương tự. Họ, đến lượt nó, "giải mã" thẻ âm thanh và chip khác và chuyển đổi thành âm thanh có thể nghe được. Nguyên tắc ở đây là về giống như trong trường hợp của tấm máy hát. Họ được biết là mỗi âm thanh tương ứng với các rãnh nhỏ trên nhựa, được công nhận bởi người đọc, và sau đó lên tiếng. Trong máy tính tất cả như thế nào. Chỉ có rãnh đóng một vai trò byte trong tự nhiên mà, như trong trường hợp của văn bản và hình ảnh, là mã nhị phân.

Nếu trong trường hợp của các yếu tố đơn vị hình ảnh máy tính nhô ra điểm, khi bản ghi âm được cái gọi là "đếm". Nó thường được quy định hai byte, tạo ra lên đến 65 ngàn. 536 microvibrations âm thanh. Tuy nhiên, trái ngược với, như xảy ra trong việc xây dựng hình ảnh để cải thiện chất lượng âm thanh được thực hiện không thêm byte bổ sung (có, rõ ràng, và quá đủ), và tăng số lượng "đếm". Mặc dù trong một số hệ thống âm thanh byte được sử dụng ít hơn và nhiều hơn nữa. Khi mã hóa âm thanh được thực hiện, các đơn vị tiêu chuẩn của byte "thông" thực hiện một giây. Microvibrations ví dụ, mã hóa bằng cách sử dụng thứ 8. Đếm mỗi giây, rõ ràng sẽ có chất lượng thấp hơn so với chuỗi âm thanh được mã hóa bởi 44.000. "Đếm".

tiêu chuẩn quốc tế của tập tin âm thanh, cũng như trong trường hợp của đồ họa, phát triển tốt. Có một số định dạng chuẩn âm thanh phương tiện truyền thông - MP3, WAV, WMA, được hưởng trên toàn thế giới.

Encoding Video

Một loại "chương trình lai", trong đó các âm thanh được kết hợp với mã hóa mã hóa hình ảnh, sử dụng trong video máy tính. Thông thường các bộ phim và các clip bao gồm hai loại dữ liệu - chính là một âm thanh và kèm theo video. Là "mã hóa" thành phần đầu tiên, chúng tôi đã nói ở trên. phức tạp hơn thứ hai một chút. Các nguyên tắc ở đây là khác nhau hơn bao gồm một mã hóa đồ họa đã thảo luận ở trên. Nhưng nhờ vào sự phổ biến của các "khái niệm" byte là những cơ chế khá dễ hiểu và hợp lý.

Nhớ lại cách xây dựng bộ phim. Nó là gì khác hơn là một loạt các bức ảnh cá nhân (thường là 24). Khá giống như cách sắp xếp video máy tính. Mỗi khung - là một hình ảnh. Về cách nó đã được xây dựng với sự giúp đỡ của byte, chúng tôi đã xác định ở trên. Đổi lại, hiện tại trong mã đoạn video được xác định khu vực, cho phép ràng buộc giữa một khung hình riêng lẻ. Một loại thay thế kỹ thuật số cho bộ phim. Một đơn vị riêng biệt của dòng video (cùng điểm cho hình ảnh và số lượng cho âm thanh, như trong "phim" và bộ phim định dạng clip), khung được xem xét. Một trong những giây cuối cùng, phù hợp với các tiêu chuẩn được chấp nhận, có thể là 25 hoặc 50.

Cũng như trong trường hợp của âm thanh, có những tiêu chuẩn quốc tế phổ biến cho video - MP4, 3GP, AVI. Các nhà sản xuất của phim ảnh và quảng cáo cố gắng để tạo ra mẫu phương tiện truyền thông tương thích với một số lượng lớn các máy tính. Các định dạng tập tin - một trong những phổ biến nhất, họ mở trên hầu hết các máy tính hiện đại.

nén dữ liệu

bộ nhớ được thực hiện trên một loạt các phương tiện truyền thông - đĩa, ổ đĩa flash, vv Như chúng tôi đã nói ở trên, byte, như một quy luật, các tiền tố "mọc" "mega", "giga", "tera", vv Trong một số trường hợp .... file mã hóa giá trị là đặt chúng với các nguồn lực sẵn không thể được trên đĩa. Sau đó, sử dụng các loại khác nhau của các kỹ thuật nén dữ liệu. Họ là, trên thực tế, cũng là một mã hóa. Đây là - một giải thích khả dĩ của thuật ngữ.

Có hai cơ chế cơ bản cho việc nén dữ liệu. Vào ngày đầu tiên của họ được viết bằng chuỗi bit "đóng gói" hình thức. Đó là, các máy tính không thể đọc được nội dung của file (chơi nó như là một văn bản, hình ảnh hoặc video), nếu bạn không thực hiện các thủ tục "giải nén". Các chương trình, mà nén dữ liệu theo cách này được gọi là một logger dữ liệu. Làm thế nào nó hoạt động khá đơn giản. dữ liệu lưu trữ là một trong những cách phổ biến nhất, trong đó để thực hiện các thông tin mã hóa, nghiên cứu máy tính cấp trường bắt buộc.

Như chúng ta đã biết, quá trình "Encryption" trong byte tập tin chuẩn. Hãy chuẩn ASCII. Để, nói rằng, để mã hóa chữ "hello", chúng ta cần 6 byte, dựa vào số lượng chữ cái. Đó là bao nhiêu không gian một tập tin với văn bản đó sẽ mất trên đĩa. Chuyện gì xảy ra nếu chúng ta viết chữ "hi" 100 lần liên tiếp? Không có gì đặc biệt - cho điều này chúng ta cần 600 byte, tương ứng, cùng một lượng không gian đĩa. Tuy nhiên, chúng ta có thể sử dụng logger dữ liệu, mà sẽ tạo ra một tập tin, có nghĩa là một số lượng nhỏ hơn nhiều byte sẽ được "mã hóa" đội mà trông giống như sau: "Xin chào nhân với 100". Bằng cách đếm số ký tự trong báo cáo này đi đến kết luận rằng để ghi lại một tập tin như vậy, chúng ta chỉ cần 19 byte. Và cùng một lượng không gian đĩa. Khi "giải nén" các tập tin lưu trữ là một "giải mã", và văn bản trở nên quan điểm nguồn từ "100 xin chào." Do đó, bằng cách sử dụng một chương trình đặc biệt, trong đó sử dụng một cơ chế mã hóa đặc biệt, chúng tôi có thể tiết kiệm một lượng đáng kể không gian đĩa.

Quá trình trên là đủ linh hoạt: không có vấn đề gì các hệ thống ký hiệu được sử dụng, các thông tin mã hóa cho mục đích nén luôn có thể thông qua dữ liệu lưu trữ.

cơ chế thứ hai là gì? Chừng mực nào đó, nó cũng tương tự như những gì được sử dụng trong các logger dữ liệu. Nhưng khác biệt cơ bản của nó là file nén rất tốt có thể xuất hiện một máy tính mà không cần "khai thác" thủ tục. Làm thế nào để cơ chế này hoạt động?

Như chúng ta nhớ, dưới hình thức ban đầu của từ "hello" chiếm 6 byte. Tuy nhiên, chúng ta có thể đi đến các trick và viết nó như thế này: "prvt". Published 4 byte. Tất cả những gì còn lại để làm - là để "dạy" máy tính để thêm trong quá trình hiển thị các tập tin chữ cái, mà chúng tôi làm sạch. Phải nói rằng trong thực tế quá trình "học tập" để tổ chức và nó không phải là cần thiết. cơ chế cơ bản của sự công nhận của các nhân vật mất tích được đưa vào phần mềm hiện đại nhất cho PC. Đó là, phần lớn các tập tin mà chúng ta đối phó mỗi ngày, cách này hay cách khác được "mã hóa" trên thuật toán này.

Tất nhiên, có những "lai" mã hóa thông tin hệ thống, có thể thực hiện nén dữ liệu trong khi cho phép cả hai phương pháp trên. Và họ có thể sẽ hiệu quả hơn về mặt tiết kiệm không gian đĩa hơn cá nhân.

Tất nhiên, hoạt động với chữ "hello", chúng tôi đặt ra chỉ những nguyên tắc cơ bản của cơ chế nén dữ liệu. Trên thực tế họ là phức tạp hơn nhiều. hệ thống thông tin khác nhau mã hóa có thể cung cấp một cơ chế vô cùng phức tạp của file "nén". Tuy nhiên, chúng ta thấy, tại các chi phí của những gì có thể được thực hiện để tiết kiệm không gian đĩa, gần mà không cần đến sự sa sút về chất lượng thông tin trên máy tính. Đặc biệt quan trọng là vai trò của nén dữ liệu khi sử dụng hình ảnh, âm thanh và video - những loại dữ liệu hơn những người khác đòi hỏi tài nguyên đĩa.

"Mã" Gì nữa là?

Như chúng tôi đã nói ở phần đầu, mã hóa - một hiện tượng phức tạp. Có bị xử lý với các nguyên tắc cơ bản của mã hóa dữ liệu kỹ thuật số dựa trên byte, chúng tôi có thể chạm vào một khu vực khác. Nó được kết nối với việc sử dụng mã số máy tính trong giá trị hơi khác nhau. Ở đây, dưới sự "mã", chúng tôi có nghĩa là không phải là một chuỗi của những người thân và số không, và bộ sưu tập của các chữ cái khác nhau và biểu tượng (trong đó, như chúng ta đã biết, và do đó được làm bằng 0 và 1), trong đó có ý nghĩa thiết thực với cuộc sống của con người hiện đại.

mã này

Tại trung tâm của bất kỳ chương trình máy tính - mã. Nó được viết bằng ngôn ngữ dễ hiểu đối với máy tính. PC, giải mã các mã thực thi lệnh nhất định. Một tính năng đặc biệt của một chương trình máy tính từ một loại dữ liệu kỹ thuật số được chứa trong mã nó có thể "giải mã" riêng của mình (người dùng chỉ cần bắt đầu quá trình).

Một tính năng của chương trình - trong sự linh hoạt tương đối của các mã được sử dụng. Đó là, cung cấp cho các máy tính trong công việc cùng một người đàn ông có thể, sử dụng một tập hợp lớn các "cụm từ", và nếu cần thiết - và trong một ngôn ngữ khác.

tài liệu đánh dấu

Một ý nghĩa thiết thực về phạm vi của mã thư - việc tạo và định dạng của văn bản. Như một quy luật, một màn hình đơn giản của các nhân vật trên màn hình là không đủ từ quan điểm về tầm quan trọng thực tiễn của PC. Trong hầu hết các trường hợp, các văn bản nên được xây dựng bằng cách sử dụng cỡ chữ nói riêng và màu sắc, được tháp tùng bởi các yếu tố bổ sung (như, ví dụ, bảng). Tất cả những thông số được thiết lập, cũng như trong trường hợp của các chương trình trên ngôn ngữ cụ thể hiểu bởi máy tính. PC, công nhận "đội", hiển thị tài liệu chính xác như người dùng mong muốn. Bên cạnh đó, các văn bản có thể được định dạng theo cách tương tự, chỉ khi nó xảy ra với các chương trình, sử dụng bộ khác nhau của "cụm từ" và ngay cả trong ngôn ngữ khác nhau.

Tuy nhiên, có một sự khác biệt cơ bản giữa các mã cho các tài liệu và các chương trình máy tính. Nó bao gồm trong thực tế là cựu không thể giải mã bản thân. Để mở file với định dạng văn bản luôn cần phần mềm của bên thứ ba.

mã hóa dữ liệu

Một giải thích các thuật ngữ "mã" là áp dụng cho các máy tính - là mã hóa. Ở trên, chúng tôi đã sử dụng từ này như một từ đồng nghĩa với thuật ngữ "mã hóa", và nó là cho phép. Ở đây, mã hóa chúng tôi có nghĩa là một loại khác nhau của hiện tượng. Cụ thể mã hóa dữ liệu kỹ thuật số để cấm truy cập vào chúng bởi những người khác. Bảo vệ các tập tin máy tính - các hoạt động quan trọng nhất trong CNTT-cầu. Điều này thực sự là một môn khoa học riêng biệt nó cũng bao gồm một máy tính trường. Mã hóa tập tin với mục đích ngăn chặn truy cập trái phép - là một nhiệm vụ, tầm quan trọng trong số đó được trình bày cho công dân của các quốc gia hiện đại trong thời thơ ấu.

Làm thế nào là cơ chế mà theo đó các mã hóa dữ liệu? Các nguyên tắc cũng đơn giản và rõ ràng như tất cả trước đó, chúng tôi đã xem xét. Encoding - một quá trình mà có thể dễ dàng giải thích được về mặt nguyên tắc cơ bản của logic.

Giả sử chúng ta cần phải truyền tải thông điệp, "Ivanov, Petrov đi vào" để không ai có thể đọc nó. Chúng tôi tin tưởng vào máy tính để mã hóa thông điệp và xem kết quả: "10-3-1-15-16-3-10-5-7-20-11-17-6-20-18-3-21". Mã này là, tất nhiên, là khá đơn giản: mỗi số tương ứng với số lượng chữ cái trong bảng chữ cái của cụm từ của chúng tôi. "Tôi" đứng trên vị trí thứ 10, "B" - 3, "A" - ngày 1, vv Tuy nhiên, hệ thống mã hóa máy tính hiện đại có thể mã hóa dữ liệu để nó sẽ nhặt để chìa khóa vô cùng khó khăn ...

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 vi.atomiyme.com. Theme powered by WordPress.