Кодиране на текстова информация в компютър. Как компютърът обработва информация Информацията, обработвана от компютър, се кодира

Запознахме се с бройните системи – начини за кодиране на числата. Цифрите дават информация за броя на артикулите. Тази информация трябва да бъде кодирана, представена в някаква числова система. Кой от известните методи да изберете зависи от решавания проблем.
Доскоро компютрите обработваха основно цифрова и текстова информация. Но човек получава по-голямата част от информацията за външния свят под формата на образи и звуци. В този случай изображението е по-важно. Спомнете си поговорката: „По-добре е да видиш веднъж, отколкото да чуеш сто пъти“. Ето защо днес компютрите започват да работят все по-активно с изображения и звук. Определено ще разгледаме методите за кодиране на такава информация.

Двоично кодиране на числови и текстова информация.

Всяка информация се кодира в компютър с помощта на последователности от две числа - 0 и 1. Компютърът съхранява и обработва информация под формата на комбинация от електрически сигнали: напрежение 0.4V-0.6V съответства на логическа нула, а напрежение 2.4V- 2.7V съответства на логическа единица. Извикват се поредици от 0 и 1 двоични кодове , а числата 0 и 1 са битове (в двоични цифри). Това кодиране на информация на компютър се нарича двоично кодиране ... По този начин, двоичното кодиране е кодиране с минималния възможен брой елементарни символи, кодиране с най-простите средства. Ето защо е забележителен от теоретична гледна точка.
Двоичното кодиране на информация привлича инженери, защото е лесно за изпълнение технически. Електронните схеми за обработка на двоични кодове трябва да бъдат само в едно от двете състояния: има сигнал/няма сигнал или високо напрежение / ниско напрежение .
Компютрите в своята работа оперират с реални и цели числа, представени под формата на два, четири, осем и дори десет байта. За представяне на знака на число при броене, допълнително знак ранг , което обикновено е преди цифровите цифри. За положителни числа битът със знак е 0, а за отрицателни числа - 1. За да напишете вътрешното представяне на отрицателно цяло число (-N), трябва:
1) вземете допълнителния код на числото N, като замените 0 с 1 и 1 с 0;
2) добавете 1 към полученото число.

Тъй като един байт не е достатъчен за представяне на това число, той се представя като 2 байта или 16 бита, неговият допълнителен код е 1111101111000101, следователно -1082 = 1111101111000110.
Ако компютърът можеше да обработва само единични байтове, нямаше да има голяма полза. В действителност компютърът работи с числа, които са записани в два, четири, осем и дори десет байта.
Започвайки от края на 60-те години, компютрите се използват все по-често за обработка на текстова информация. За представяне на текстова информация обикновено се използват 256 различни знака, например главни и малки букви на латинската азбука, цифри, препинателни знаци и др. В повечето съвременни компютри всеки знак съответства на поредица от осем нули и единици, наречени байт .
Байтът е осембитова комбинация от нули и единици.
При кодиране на информация в тези електронни компютри се използват 256 различни последователности от 8 нули и единици, което прави възможно кодирането на 256 знака. Например, голямата руска буква "M" има код 11101101, буквата "I" - код 11101001, буквата "P" - код 11110010. Така думата "WORLD" е кодирана с последователност от 24 бита или 3 байта: 111011011110100111110010.
Броят на битовете в съобщението се нарича информационен обем на съобщението. Интересно е!

Първоначално в компютрите се използва само латинската азбука. Има 26 букви. Така че пет импулса (бита) биха били достатъчни за обозначаване на всеки един. Но текстът съдържа препинателни знаци, десетични цифри и т. н. Следователно в първите англоезични компютри един байт - машинна сричка - включваше шест бита. След това седем - не само за разграничаване на големи от малки букви, но и за увеличаване на броя на контролните кодове за принтери, сигнални светлини и друго оборудване. През 1964 г. се появява мощният IBM-360, в който байтът най-накрая става равен на осем бита. Последният осми бит беше необходим за псевдографични герои.
Присвояването на специфичен двоичен код на символ е въпрос на конвенция, която е фиксирана в кодовата таблица. За съжаление има пет различни кодировки на руски букви, така че текстовете, създадени в едно кодиране, няма да бъдат правилно отразени в друго.
Хронологично един от първите стандарти за кодиране на руски букви на компютри е KOI8 („Код за обмен на информация, 8 бита“). Най-често срещаното кодиране е стандартното кодиране на кирилица на Microsoft Windows, обозначено с абревиатурата CP1251 („CP“ означава „Code Page“ или „code page“). Apple разработи собствено кодиране на руски букви (Mac) за компютри Macintosh. Международната организация по стандартизация (Международна организация по стандартизация, ISO) одобри кодирането ISO 8859-5 като стандарт за руския език. Най-накрая се появи нов международен стандарт Unicode, който отделя не един байт, а два за всеки знак и следователно с негова помощ е възможно да се кодират не 256 знака, а цели 65536.
Всички тези кодировки продължават кодовата таблица на ASCII (Американски стандартен код за обмен на информация), която кодира 128 знака.
ASCII таблица със знаци:

код	символ	код	символ	код	символ	код	символ	код	символ	код	символ
32	Космос	48	.	64	@	80	П	96	"	112	стр
33	!	49	0	65	А	81	В	97	а	113	q
34	"	50	1	66	Б	82	Р	98	б	114	r
35	#	51	2	67	° С	83	С	99	° С	115	с
36	$	52	3	68	д	84	T	100	д	116	T
37	%	53	4	69	Е	85	У	101	д	117	u
38	&	54	5	70	Ф	86	V	102	е	118	v
39	"	55	6	71	Г	87	У	103	ж	119	w
40	(	56	7	72	Х	88	х	104	з	120	х
41	)	57	8	73	аз	89	Й	105	и	121	г
42	*	58	9	74	Дж	90	З	106	j	122	z
43	+	59	:	75	К	91	[	107	к	123	{
44	,	60	;	76	Л	92	\	108	л	124	\|
45	-	61	<	77	М	93	]	109	м	125	}
46	.	62	>	78	н	94	^	110	н	126	~
47	/	63	?	79	О	95	_	111	о	127	DEL

Двоичното кодиране на текст става по следния начин: при натискане на клавиш определена последователност от електрически импулси се предава на компютъра и всеки знак съответства на собствена последователност от електрически импулси (нули и единици на машинния език). Програмата, драйверът на клавиатурата и екрана, според кодовата таблица, определя символа и създава неговото изображение на екрана. Така текстовете и числата се съхраняват в паметта на компютъра в двоичен код и се преобразуват програмно в изображения на екрана.

Двоично кодиране на графична информация.

От 80-те години технологията за обработка на графична информация на компютър се развива бързо. Компютърната графика намира широко приложение в компютърното моделиране в научни изследвания, компютърни симулатори, компютърна анимация, бизнес графика, игри и др.
Графичната информация на екрана на дисплея се представя под формата на изображение, което се формира от точки (пиксели). Погледнете внимателно снимка от вестници и ще видите, че тя също се състои от най-малките точки. Ако това са само черни и бели точки, тогава всяка от тях може да бъде кодирана с 1 бит. Но ако на снимката има нюанси, тогава два бита ви позволяват да кодирате 4 нюанса на точки: 00 - бяло, 01 - светло сиво, 10 - тъмно сиво, 11 - черно. Три бита ви позволяват да кодирате 8 нюанса и т.н.
Броят битове, необходими за кодиране на един нюанс на цвета, се нарича дълбочина на цвета.

V съвременни компютри резолюция (броят на точките на екрана), както и броят на цветовете зависи от видеоадаптера и може да се променя програмно.
Цветните изображения могат да имат различни режими: 16 цвята, 256 цвята, 65536 цвята ( висок цвят), 16 777 216 цвята ( истински цвят). Една точка за режим висок цвятНеобходими са 16 бита или 2 байта.
Най-често срещаната резолюция на екрана е 800 на 600 пиксела, т.е. 480 000 точки. Нека изчислим количеството видео памет, необходима за режима на високи цветове: 2 байта * 480 000 = 960 000 байта.
За измерване на количеството информация се използват и по-големи единици:

Следователно 960 000 байта са приблизително равни на 937,5 KB. Ако човек говори осем часа на ден без прекъсване, тогава за 70 години от живота си той ще говори около 10 гигабайта информация (това са 5 милиона страници - купчина хартия с височина 500 метра).
Скоростта на предаване е броят на предаваните битове в секунда. Скоростта на предаване от 1 бит в секунда се нарича 1 бод.

Във видеопаметта на компютъра се съхранява растерна карта, която е двоичен код на изображение, откъдето се чете от процесор (поне 50 пъти в секунда) и се показва на екрана.

Двоично кодиране на аудио информация.

От началото на 90-те години персонални компютриполучи възможността да работи със здрава информация. Всеки компютър със звукова карта може да записва като файлове ( файлът е определено количество информация, съхранявана на диска и именувана ) и възпроизвежда аудио информация. С помощта на специални софтуерни инструменти (редактори на аудио файлове) се отварят широки възможности за създаване, редактиране и слушане на звукови файлове. Създават се програми за разпознаване на говор и става възможно да се управлява компютърът с глас.
Именно звуковата карта (карта) преобразува аналоговия сигнал в дискретна фонограма и обратно, "дигитализирания" звук - в аналогов (непрекъснат) сигнал, който се подава на входа на високоговорителя.

При двоично кодиране на аналогов аудио сигнал, непрекъснатият сигнал се пробва, т.е. се заменя с поредица от негови отделни проби - показания. Качеството на двоичното кодиране зависи от два параметъра: броя на дискретните нива на сигнала и броя на пробите в секунда. Броят на пробите или честотата на дискретизация в аудио адаптерите е различен: 11 kHz, 22 kHz, 44,1 kHz и т.н. Ако броят на нивата е 65536, тогава за един звуков сигнал се изчисляват 16 бита (216). 16-битов аудио адаптер кодира и възпроизвежда звук по-точно от 8-битов аудио адаптер.
Броят битове, необходими за кодиране на едно ниво на аудио, се нарича дълбочина на звука.
Размерът на моно-аудио файл (в байтове) се определя по формулата:

При стерео звук силата на звука на аудио файла се удвоява, при квадрафоничния звук се учетворява.
С усложняването на програмите и увеличаването на техните функции, както и с появата на мултимедийни приложения, функционалният обем на програмите и данните расте. Ако в средата на 80-те години обичайният обем на програми и данни беше десетки и само понякога стотици килобайта, то в средата на 90-те той започна да възлиза на десетки мегабайта. Съответно количеството RAM нараства.

Има различни видове информация, например:

Мирис, вкус, звук;

Символи и знаци.

В различни отрасли на науката, културата и техниката са разработени специални формуляри за записване на информация.

коде група от символи, които могат да се използват за показване на информация.

Извиква се процесът на преобразуване на съобщение в комбинация от знаци в съответствие с кода кодиране.

Съществува три основни начина за кодиранеинформация:

Числен начин- използване на числа.
Символичен начин - информацията се кодира с помощта на символи от същата азбука като изходящия текст.
Графичен начин - информацията е кодирана с помощта на снимки или икони.

Примери за информация за кодиране:

За показване на звуците на руската азбука използвайте писма(АБВГДЕЕЖ ... ЕЮЯ);

За показване на числа използвайте числа (0123456789);

Звуците се записват бележкии други символи;

Използването на слепи брайлово писмо, където буквата се състои от шест елемента: дупки и туберкули.

Брайлова азбука

Трябва да се има предвид, че без да се познават принципите на кодиране на информация, един и същ код може да бъде разбран по различни начини, например числото 300522005 може да се изчисли за число, телефонен номер или за население.

Компютърът кодира въведената информация: текст, изображения и звуци. В криптирана форма компютърът обработва, съхранява и изпраща информация. За да се покаже информация от компютър в разбираема от човека форма, тя трябва да бъде декодира .

Специалната наука се занимава с методите за криптиране - криптография .

В компютъра се използват само два знака за кодиране на информация: 0 и 1 , тъй като е по-лесно за компютърен техник да реализира две състояния:

0 - няма сигнал (няма напрежение или не тече ток);

1 - има сигнал (има напрежение или ток).

Генериране на код.

Един бит може да кодира две състояния: 0 и 1 (да и не, черно и бяло). Ако увеличите броя на битовете с един, получавате два пъти повече кодове.

пример:

Два бита създават 4 различни кода: 00, 01, 10 и 11;

три бита създават 8 различни кода: 000, 001, 010, 011, 100, 101, 110 и 111.

Кодиране на различни видове информация

Кодиране на текст

Когато кодирате текст, на всеки знак се присвоява някаква стойност, например пореден номер.

Първият популярен компютърен стандарт за кодиране на текст се нарича ASCII(Американски стандартен код за обмен на информация), който използва 7 бита за кодиране на всеки знак.

Със 7 бита можете да кодирате 128 знака: големи и малки латински букви, цифри, препинателни знаци, както и специални знаци, например "§".

Стандартът е създаден в различни версии, допълвайки кода до 8 бита (256 знака), така че е възможно да се кодират национални знаци, например латвийската буква ā.

Но 256 знака не бяха достатъчни за кодиране на всички знаци в различни азбуки, така че бяха създадени нови стандарти. Един от най-популярните в наше време е ЮНИКОД... При което всеки знак е кодиран в 2 байта, резултатът е 62536 различни кода.

Кодиране на графични данни

Почти всички създадени и обработени изображения, съхранявани на компютър, могат да бъдат разделени на две групи:

Растерна графика;

Векторни графики.

Всяко изображение, създадено в растерна графика, се състои от цветни точки. Тези точки се наричат пиксели (пиксел) .

За кодиране нецветни изображенияобикновено се използва 256 нюанса на сивотовариращи от бяло до черно. За да кодирате всички цветове, трябва 8 бита(1 байт).

За кодиране цветни изображенияобикновено се използват три цвята: червено, зелено и синьо... Цветен тон се получава чрез смесване на тези три цвята.

Кодиране на звук

Звуците идват отзад колебаниевъздух. Звукът има две измерения:

- амплитуда на трептенекоето сочи към сила на звуказвук;

- честота на трептенекоето сочи към ключзвук.

Звукът може да се преобразува в електрически сигнал, например с микрофон.

Звукът се кодира чрез измерване на размера на сигнала след точен интервал от време и присвояване на двоична стойност към него. Колкото по-често се правят тези измервания, толкова повече по-добро качествозвук.

пример:

Един CD с обем от 700 MB може да побере 80 минути звук с качество на CD.

Кодиране на видео

Филмът се състои от кадри, които се сменят бързо. Кодираният филм съдържа информация за размера на кадъра, използваните цветове и броя на кадъра в секунда (обикновено 30), както и начина на запис на звука – всеки кадър поотделно или целия филм наведнъж.

код - система от конвенционални знаци (символи) за предаване, обработка и съхранение на информация (съобщения).

Кодиране- процесът на представяне на информация (съобщения) под формата на код.

Извиква се целият набор от символи, използвани за кодиране азбучно кодиране... Например в паметта на компютъра всяка информация се кодира с помощта на двоична азбука, съдържаща само два знака: 0 и 1.

Научните основи на кодирането са описани от К. Шанън, който изследва процесите на пренос на информация чрез технически комуникационни канали ( теория на комуникацията, теория на кодирането). С този подход кодиранесе разбира в по-тесен смисъл: как преход от представяне на информация в една символна система към представяне в друга символна система... Например, преобразуване на писмен руски текст в морзова азбука за предаване чрез телеграфна или радиокомуникация. Такова кодиране е свързано с необходимостта от адаптиране на кода към използваните технически средства за работа с информация (вж. Прехвърляне на информация").

Декодиране - процесът на преобразуване на кода обратно във формата на оригиналната символна система, т.е. получаване на оригиналното съобщение. Например: превод от морзова азбука в писмен текст на руски език.

В по-широк смисъл декодирането е процесът на възстановяване на съдържанието на кодирано съобщение. С този подход процесът на писане на текст с руската азбука може да се разглежда като кодиране, а четенето му е декодиране.

Цели на кодиране и методи на кодиране

Начинът, по който едно и също съобщение е кодирано, може да бъде различен. Например, ние сме свикнали да пишем руски текст с руската азбука. Но същото може да се направи с помощта на английската азбука. Понякога трябва да направите това, като изпратите SMS чрез мобилен телефонкойто няма руски букви, или чрез изпращане на имейл на руски от чужбина, ако няма руски език на компютъра софтуер... Например фразата: "Здравей, скъпи Саша!" трябва да напишете така: „Здравствуй, дорогой Саша!”.

Има и други начини за кодиране на речта. Например, стенография - бърз начинустни записи... Тя е собственост само на няколко специално обучени хора – стенографисти. Стенографът успява да запише текста синхронно с речта на говорещия. В преписа една икона обозначаваше цяла дума или фраза. Само стенографист може да дешифрира (декодира) преписа.

Тези примери илюстрират следното важно правило: могат да се използват различни методи за кодиране на една и съща информация; техният избор зависи от редица обстоятелства: целта на кодирането, условията, наличните средства.Ако трябва да запишете текста със скоростта на речта, ние използваме стенография; ако трябва да прехвърлите текст в чужбина, ние използваме английската азбука; ако е необходимо да представим текста във форма, разбираема за грамотен руски човек, ние го записваме според правилата на граматиката на руския език.

Друго важно обстоятелство: изборът на метод за кодиране на информация може да бъде свързан с предвидения метод за нейната обработка... Нека покажем това с примера за представяне на числата - количествена информация. Използвайки руската азбука, можете да запишете числото „тридесет и пет“. Използвайки азбуката на арабската десетична бройна система, пишем: „35“. Вторият метод е не само по-кратък от първия, но и по-удобен за извършване на изчисления. Кой запис е по-удобен за извършване на изчисления: „тридесет и пет пъти сто двадесет и седем“ или „35 x 127“? Очевидно - второто.

Въпреки това, ако е важно да запазите числото без изкривяване, тогава е по-добре да го запишете в текстова форма. Например, в паричните документи сумата често се записва в текстова форма: „триста седемдесет и пет рубли“. вместо "375 рубли". Във втория случай изкривяването на една цифра ще промени цялата стойност. Когато използвате текстова форма, дори граматическите грешки може да не променят значението. Например, един неграмотен човек написа: „Триста седемдесет и пет рубли“. Смисълът обаче остана.

В някои случаи има нужда да се класифицира текстът на съобщение или документ, така че да не може да бъде прочетен от тези, които не трябва да го правят. Нарича се защита срещу неоторизиран достъп... В този случай секретният текст е криптиран. В древни времена криптирането се е наричало криптография. Криптиранее процесът на преобразуване на отворен текст в криптиран и декриптиране- процесът на обратна трансформация, при който се възстановява оригиналният текст. Шифроването също е кодиране, но с таен метод, известен само на източника и адресата. Методите за криптиране се занимават с наука, наречена криптография(см ... "Криптография").

История на техническите методи за кодиране на информация

С появата на технически средства за съхранение и предаване на информация се появиха нови идеи и техники за кодиране. Първото техническо средство за предаване на информация на разстояние е телеграфът, изобретен през 1837 г. от американеца Самюъл Морс. Телеграфното съобщение е поредица от електрически сигнали, предавани от един телеграфен апарат по проводници към друг телеграфен апарат. Тези технически обстоятелства доведоха С. Морз до идеята да използва само два вида сигнали - къси и дълги - за кодиране на съобщение, предавано по телеграфни линии.

Самюел Финли Бриз Морс (1791-1872), САЩ

Този метод на кодиране се нарича морзова азбука. В него всяка буква от азбуката е кодирана с поредица от къси сигнали (точки) и дълги сигнали (тирета). Буквите са разделени една от друга с паузи - няма сигнали.

Най-известното телеграфно съобщение е сигналът за бедствие „SOS“ ( Спр Оур С ouls- спаси душите ни). Ето как изглежда в морзова азбука, приложена към английската азбука:

–––

Три точки (буква S), три тирета (буква O), три точки (буква S). Две паузи разделят буквите една от друга.

Фигурата показва морзовата азбука, приложена към руската азбука. Нямаше специални препинателни знаци. Записваха се с думите: "точка" - точка, "зпт" - запетая и т.н.

Характерна особеност на морзовата азбука е код с променлива дължина от различни буквитака се нарича морзовата азбука неравномерен код... Буквите, които се срещат по-често в текста, имат по-кратък код от редките букви. Например, кодът за буквата „E“ е една точка, а твърдият код на символа е дълъг шест знака. Това се прави, за да се съкрати дължината на цялото съобщение. Но поради променливата дължина на буквения код има проблем с отделянето на буквите една от друга в текста. Следователно е необходимо да се използва пауза (пропускане) за раздяла. Следователно телеграфната азбука на Морз е троична, тъй като използва три знака: точка, тире, празнина.

Единен телеграфен коде изобретен от французина Жан Морис Бодо в края на 19 век. Той използва само два различни типа сигнали. Няма значение как ги наричате: точка и тире, плюс и минус, нула и едно. Това са два различни електрически сигнала. Дължината на кода на всички знаци е еднакваи е равно на пет. В този случай проблемът с отделянето на буквите една от друга не възниква: всеки пет от сигналите е знак за текста. Следователно пропуск не е необходим.

Жан Морис Емил Бодо (1845-1903), Франция

Кодът на Бодо е първият метод за двоично кодиране на информация в историята на технологиите.... Благодарение на тази идея беше възможно да се създаде телеграфен апарат за директен печат, който прилича на пишеща машина. Натискането на клавиш с конкретна буква генерира съответен петимпулсен сигнал, който се предава по комуникационната линия. Приемащата машина, под въздействието на този сигнал, отпечатва същата буква върху хартиената лента.

В съвременните компютри единен двоичен код също се използва за кодиране на текстове (вж. Системи за кодиране на текст ").

Темата за информационното кодиране може да бъде представена в учебната програма на всички етапи на изучаване на информатика в училище.

В пропедевтичния курс на студентите по-често се предлагат задачи, които не са свързани с компютърно кодиране на данни и са в известен смисъл игрова форма. Например, въз основа на таблицата с морзовата азбука, можете да предложите както задачи за кодиране (кодиране на руски текст с морзова азбука), така и декодиране (дешифриране на текст, кодиран с морзова азбука).

Изпълнението на такива задачи може да се тълкува като работа на ransomware, предлагащ различни прости ключове за криптиране. Например буквено-цифрово, заменящо всяка буква с нейния порядков номер в азбуката. Освен това към азбуката трябва да се добавят препинателни знаци и други символи, за да се кодира напълно текстът. Поканете учениците да измислят начин да разграничат малките от главните букви.

При изпълнение на такива задачи учениците трябва да бъдат насочени към факта, че е необходим разделителен знак - интервал, тъй като кодът се оказва неравномерно: някои букви са криптирани с една цифра, други с две.

Поканете учениците си да помислят как можете да направите, без да разделяте буквите в кода си. Тези отражения трябва да доведат до идеята за единен код, в който всеки знак е кодиран с две десетични цифри: A - 01, B - 02 и т.н.

Избор на задачи за кодиране и криптиране на информация има в редица учебници за училището.

В основния курс по компютърни науки за основното училище темата за кодирането до голяма степен е свързана с темата за представяне на различни видове данни в компютър: числа, текстове, изображения, звук (вж. Информационни технологии”).

В старшите класове, в съдържанието на общообразователен или избираем курс, могат да се обсъждат по-подробно въпроси, свързани с теорията на кодирането, разработена от Шанън в рамките на теорията на информацията. Тук има редица интересни проблеми, чието разбиране изисква повишено ниво на математическа и програмна подготовка на учениците. Това са проблемите на икономичното кодиране, универсалния алгоритъм за кодиране, кодирането с корекция на грешки. Много от тези въпроси са разкрити подробно в урока "Математически основи на информатиката".

1. Андреева Е.V.,Босова Л.Л.,Фалина И.н... Математически основи на компютърните науки. Избираема дисциплина. М.: БИНОМ. Лаборатория на знанието, 2005 г.

2. Бешенков С.А.,Ракитина Е.А... Информатика. Систематичен курс. Учебник за 10 клас. М .: Лаборатория за основни знания, 2001, 57 стр.

3.Винер Н... Кибернетика, или контрол и комуникация в животно и машина. Москва: Съветско радио, 1968, 201 с.

4. Информатика. Работилна книга в 2 тома / Изд. I.G. Семакина, Е.К. Хенър. Т. 1.М .: БИНОМ. Лаборатория на знанието, 2005 г.

5. А. А. Кузнецов, С. А. Бешенков, Е. А. Ракитина, Н. В. Матвеева, Л. В. МилохинаНепрекъснат курс по информатика (концепция, система от модули, типична програма). Информатика и образование, No1, 2005г.

6. Математически енциклопедичен речник. Раздел: „Речник по училищна информатика”. Москва: Съветска енциклопедия, 1988.

7.Фридланд А.АЗ СЪМ... Информатика: процеси, системи, ресурси. М.: БИНОМ. Лаборатория на знанието, 2003 г.

Съвременният компютър може да обработва цифрова, текстова, графична, звукова и видео информация. Всички тези видове информация в компютъра са представени в двоичен код, тоест се използва азбука с капацитет от два знака (0 и 1). Това се дължи на факта, че е удобно информацията да се представя под формата на последователност от електрически импулси: няма импулс (0), има импулс (1). Такова кодиране обикновено се нарича двоично, а самите логически последователности от нули и единици се наричат машинен език.

Всяка цифра от машинния двоичен код носи количеството информация, равно на един бит.

Този извод може да се направи, като се разглеждат числата от машинната азбука като равновероятни събития. При записване на двоична цифра е възможно да се реализира изборът само на едно от двете възможни състояния, което означава, че то носи количество информация, равно на 1 бит. Следователно, две цифри носят информация 2 бита, четири бита - 4 бита и т.н. За да се определи количеството информация в битове, е достатъчно да се определи броят на цифрите в двоичния машинен код.

Кодиране на текстова информация

В момента повечето потребители, използващи компютър, обработват текстова информация, която се състои от символи: букви, цифри, препинателни знаци и др.

На базата на една клетка с информационен капацитет от 1 бит могат да бъдат кодирани само 2 различни състояния. За да може всеки знак, който може да бъде въведен от клавиатурата в латински регистър, да получи свой собствен уникален двоичен код, са необходими 7 бита. Въз основа на последователност от 7 бита, в съответствие с формулата на Хартли, могат да се получат N = 2 7 = 128 различни комбинации от нули и единици, т.е. двоични кодове. Като асоциираме всеки знак с неговия двоичен код, получаваме таблица за кодиране. Човек оперира със символи, компютър - с техните двоични кодове.

За подредбата на латинската клавиатура такава таблица за кодиране е една за целия свят, следователно текстът, въведен с помощта на латинската клавиатурна подредба, ще бъде адекватно показан на всеки компютър. Тази таблица се нарича ASCII (Американски стандартен код за обмен на информация) на английски, произнася се [eski], на руски се произнася [aski]. По-долу е цялата ASCII таблица, кодовете в която са посочени в десетична форма. Може да се използва, за да се определи, че когато въведете от клавиатурата, да речем, символа „*“, компютърът го възприема като код 42 (10), на свой ред 42 (10) = 101010 (2) - това е двоичният код на знака „*“. Кодове от 0 до 31 не се използват в тази таблица.

ASCII таблица със знаци

За да се кодира един знак, се използва количество информация, равно на 1 байт, тоест I = 1 байт = 8 бита. Използвайки формула, която свързва броя на възможните събития K и количеството информация I, можете да изчислите колко различни символа могат да бъдат кодирани (като приемем, че символите са възможни събития):

K = 2 I = 2 8 = 256,

тоест, азбука с капацитет от 256 знака може да се използва за представяне на текстова информация.

Същността на кодирането е, че на всеки знак се присвоява двоичен код от 00000000 до 11111111 или съответният десетичен код от 0 до 255.

Трябва да се помни, че в момента за кодиране на руски букви се използват пет различни кодови таблици(KOI - 8, CP1251, CP866, Mac, ISO) и текстовете, кодирани с помощта на една таблица, няма да се показват правилно в друго кодиране. Това може да бъде ясно представено като фрагмент от комбинираната таблица за кодиране на знаци.

На един и същ двоичен код се приписват различни символи.

Двоичен код	Десетичен код

Въпреки това, в повечето случаи не потребителят се грижи за прекодирането на текстови документи, а специални програми - конвертори, които са вградени в приложенията.

От 1997 г. последните версии на Microsoft Office поддържат новото кодиране. Нарича се Unicode. Unicode е кодова книга, която използва 2 байта за кодиране на всеки знак, т.е. 16 бита. Въз основа на такава таблица могат да бъдат кодирани N = 2 16 = 65 536 знака.

Unicode включва почти всички съвременни писмености, включително: арабски, арменски, бенгалски, бирмански, гръцки, грузински, деванагари, иврит, кирилица, коптски, кхмерски, латински, тамилски, хангул, хан (Китай, Япония, Корея), чероки, етиопски, японски (катакана, хирагана, канджи) и др.

За академични цели са добавени много исторически скриптове, включително: старогръцки, египетски йероглифи, клинопис, писане на маите, етруска азбука.

Unicode предоставя широка гама от математически и музикални символи и пиктограми.

Има два кодови диапазона за знаци на кирилица в Unicode:

кирилица (# 0400 - # 04FF)

Допълнение на кирилица (# 0500 - # 052F).

Но внедряването на Unicode таблицата в чист вид се въздържа поради причината, че ако кодът от един знак заема не един байт, а два байта, че за съхранение на текст ще отнеме два пъти повече дисково пространство, а за неговото прехвърляне по комуникационни канали - два пъти по-дълго.

Следователно на практика днес Unicode представянето на UTF-8 (Unicode Transformation Format) е по-често срещано. UTF-8 осигурява най-добрата съвместимост със системи, използващи 8-битови символи. Текстът, съдържащ само символи, номерирани по-малко от 128, се преобразува в обикновен ASCII текст, когато е написан в UTF-8. Останалите символи на Unicode са представени от поредици от 2 до 4 байта с дължина. Като цяло, тъй като най-често срещаните знаци в света - знаците на латинската азбука - в UTF-8 все още заемат 1 байт, това кодиране е по-икономично от чистия Unicode.

За да определите цифровия символен код, можете да използвате кодовата таблица. За да направите това, изберете елемента "Вмъкване" - "Символ" в менюто, след което на екрана се появява диалоговият прозорец Символ. Таблицата със символи за избрания шрифт се появява в диалоговия прозорец. Знаците в тази таблица са подредени ред по ред, последователно отляво надясно, като се започне със знака за интервал.

Векторни и фрактални изображения.

Векторно изображениее графичен обект, състоящ се от елементарни линии и дъги. Основният елемент на изображението е линия. Като всеки обект, той има свойства: форма (права, крива), дебелина., Цвят, стил (точков, плътен). Затворените линии имат свойството да се запълват (или с други обекти, или с избран цвят). Всички други векторни графични обекти са съставени от линии. Тъй като линията се описва математически като единичен обект, количеството данни за показване на обект с помощта на векторна графика е много по-малко, отколкото в растерната графика. Информация за векторно изображениекодирани като нормални букви и цифри и обработени от специални програми.

Софтуерните инструменти за създаване и обработка на векторни графики включват следните GR: CorelDraw, Adobe Illustrator, както и векторизатори (tracer) – специализирани пакети за конвертиране на растерни изображения във векторни.

Фрактална графикасе основава на математически изчисления, като вектор. Но за разлика от вектора, неговият основен елемент е самата математическа формула. Това води до факта, че в паметта на компютъра не се съхраняват никакви обекти и изображението се изгражда само чрез уравнения. Използвайки този метод, можете да изградите най-простите регулярни структури, както и сложни илюстрации, имитиращи пейзажи.

Задачи.

Известно е, че видеопаметта на компютъра е 512 KB. Резолюция на екрана 640 на 200
а) от 8 цвята;
б) 16 цвята;
в) 256 цвята?

Колко бита са необходими за кодиране на информация за 130 нюанса? Лесно е да се изчисли това 8 (тоест 1 байт), тъй като със 7 бита можете да съхранявате номера на нюанса от 0 до 127, а 8 бита съхраняват от 0 до 255. Лесно е да видите, че този метод на кодиране не е оптимално: 130 е забележимо по-малко от 255. Помислете как да уплътните информацията за чертеж, когато го записвате във файл, ако е известно, че
а) чертежът едновременно съдържа само 16 цветови нюанса от 138 възможни;
б) всичките 130 нюанса присъстват на чертежа едновременно, но броят на точките, боядисани в различни нюанси, е много различен.

А) очевидно е, че 4 бита (половин байт) са достатъчни за съхраняване на информация за 16 нюанса. Въпреки това, тъй като тези 16 нюанса са избрани от 130, те може да имат числа, които не се вписват в 4 бита. Затова ще използваме метода на палитрата. Нека присвоим нашите „местни” числа от 1 до 15 на 16-те нюанса, използвани в нашия чертеж, и да кодираме целия чертеж със скорост от 2 точки на байт. И след това добавете към тази информация (в края на файла, който го съдържа) таблица за търсене, състояща се от 16 двойки байтове с номера на нюансите: 1 байт е нашия „локален“ номер на тази фигура, вторият е реалния номер на този нюанс . (когато вместо последното се използва кодирана информация за самия нюанс, например информация за яркостта на сиянието на „електронните оръдия“ червено, зелено, синьо на електронно-лъчева тръба, тогава такава таблица ще представляват палитра от цветове). Ако чертежът е достатъчно голям, печалбата в размера на получения файл ще бъде значителна;
б) ще се опитаме да приложим най-простия алгоритъм за архивиране на информация за фигурата. Нека зададем трите нюанса, които запълват минималния брой точки, кодове 128 - 130, а останалите нюанси - кодове 1 - 127. Ще запишем във файл (който в този случай не е поредица от байтове, а непрекъснат битов поток) седембитови кодове за нюанси с числа от 1 до 127. последвани от двубитово „локално“ число и при в края на файла добавете таблица за съответствие между "местни" и реални числа. Тъй като нюансите с кодове 128 - 130 са редки, ще има няколко седембитови нули.

Имайте предвид, че задаването на въпроси в този проблем не изключва други решения, без препратка към цветовата композиция на изображението - архивиране:
а) на базата на подчертаване на поредица от точки, боядисани със същите нюанси и замяна на всяка от тези поредици с двойка числа (цвят), (количество) (този принцип е в основата на графичния формат PCX);
б) чрез сравняване на пикселни линии (записване на броя на нюансите на точките на първата страница като цяло, а за следващите редове записване на броя на нюансите само на онези точки, чиито нюанси се различават от нюансите на точки в същата позиция в предишната линия - това е основата на GIF формата);
в) използване на алгоритъм за пакетиране на фрактални изображения (формат YPEG). (IO 6,1999)

Светът е изпълнен с голямо разнообразие от звуци: тиктакането на часовниците и бръмченето на моторите, виенето на вятъра и шумоленето на листата, пеенето на птиците и гласовете на хората. Хората започнаха да гадаят как се раждат звуците и какви са те много дълго време. Дори древногръцкият философ и учен - енциклопедистът Аристотел, въз основа на наблюдения, обяснява природата на звука, вярвайки, че звучащото тяло създава редуващо се компресиране и разреждане на въздуха. И така, една осцилираща струна понякога се разрежда, след това кондензира въздуха и поради еластичността на въздуха тези редуващи се влияния се предават по-нататък в пространството - от слой на слой възникват еластични вълни. Когато стигнат до ухото ни, те действат върху тъпанчетата и създават усещане за звук.

На ухо човек възприема еластични вълни с честота някъде в диапазона от 16 Hz до 20 kHz (1 Hz - 1 вибрация в секунда). В съответствие с това еластичните вълни във всяка среда, чиито честоти са в определени граници, се наричат звукови вълни или просто звук. При изучаването на звука се използват понятия като тони тембързвук. Всеки реален звук, независимо дали става дума за свирене на музикални инструменти или глас на човек, е вид смесица от много хармонични вибрации с определен набор от честоти.

Нарича се трептението, което има най-ниска честота основен тон,друго - обертонове.

Тембър- различен брой обертонове, присъщи на определен звук, което му придава специален цвят. Разликата между един тембър от друг се дължи не само на броя, но и на интензивността на обертоновете, придружаващи звука на основния тон. По тембъра лесно можем да различим звуците на пиано и цигулка, китара и флейта и да разпознаем гласа на познат човек.

Музикалният звук може да се характеризира с три качества: тембър, тоест цветът на звука, който зависи от формата на вибрациите, височината, която се определя от броя на вибрациите в секунда (честота) и силата на звука, което зависи от интензивността на вибрациите.

Компютърът вече се използва широко в различни области. Обработката на звукова информация и музика не бяха изключение. До 1983 г. всички музикални записи се издават на винилови плочи и компакт-касети. В момента компактдискове са широко използвани. Ако имате компютър, на който е инсталирана студийна звукова карта, с MIDI клавиатура и микрофон, свързани към него, тогава можете да работите със специализиран музикален софтуер.

Обикновено тя може да бъде разделена на няколко вида:

1) всички видове помощни програми и драйвери, предназначени за работа със специфични звукови карти и външни устройства;
2) аудио редактори, които са предназначени да работят със звукови файлове, ви позволяват да извършвате всякакви операции с тях - от разделяне на части до обработка с ефекти;
3) софтуерни синтезатори, които се появиха сравнително наскоро и работят правилно само на мощни компютри. Те ви позволяват да експериментирате със създаването на различни звуци;
други.

Първата група включва всички помощни програми на операционната система. Например, win 95 и 98 имат свои собствени миксери и помощни програми за възпроизвеждане/запис на аудио, възпроизвеждане на CD и стандартни MIDI файлове. След като инсталирате звукова карта, можете да използвате тези програми, за да проверите нейната производителност. Например програмата Phonograph е проектирана да работи с уейв файлове (файлове със звукозапис в Windows формат). Тези файлове имат разширението .WAV. Тази програма предоставя възможност за възпроизвеждане, запис и редактиране на техники за звукозапис, подобни на техниките за работа с магнетофон. Препоръчително е да свържете микрофон към компютър, за да работите с Phonograph. Ако трябва да направите звукозапис, тогава трябва да вземете решение за качеството на звука, тъй като продължителността на звука зависи от това. Възможната продължителност на звука е толкова по-кратка, колкото по-високо е качеството на записа. При средно качество на запис, речта може да бъде записана задоволително, създавайки файлове с дължина до 60 секунди. Приблизително 6 секунди ще бъде запис с качество на музикален компактдиск.

Но как става аудио кодирането? От детството сме изправени пред записи на музика на различни носители: грамофонни плочи, касети, компактдискове и др. В момента има два основни начина за запис на звук: аналогови и цифрови.Но за да се запише звук на някакъв носител, той трябва да се преобразува в електрически сигнал.

Това се прави с помощта на микрофон. Най-простите микрофони имат мембрана, която вибрира със звукови вълни. Намотка е прикрепена към мембраната и се движи синхронно с мембраната в магнитно поле. В бобината се генерира променлив електрически ток. Вариациите на напрежението отразяват точно звуковите вълни.

Нарича се променлив електрически ток, който се появява на изхода на микрофона аналоговсигнал. Когато се прилага към електрически сигнал, "аналогов" означава, че сигналът е непрекъснат във времето и амплитудата. Той отразява точно формата на звуковата вълна, която се движи във въздуха.

Звуковата информация може да бъде представена в дискретна или аналогова форма. Тяхната разлика е, че при дискретно представяне на информация физическата величина се променя рязко („стълба“), като приема краен набор от стойности. Ако информацията е представена в аналогова форма, тогава физическото количество може да приеме безкраен брой стойности, които непрекъснато се променят.

Виниловият запис е пример за аналогово съхранение на звукова информация, тъй като звуковата песен непрекъснато променя формата си. Но аналоговите касетофонни записи имат голям недостатък – стареенето на носителя. В течение на една година фонограма, която е имала нормално ниво на високи честоти, може да ги загуби. Виниловите плочи губят качество няколко пъти при възпроизвеждане. Поради това се дава предпочитание на цифровия запис.

В началото на 80-те години се появяват компактдискове. Те са пример за дискретно съхранение на аудио информация, тъй като аудиозаписът на CD съдържа области с различна отразяваща способност. На теория тези цифрови дискове могат да издържат вечно, ако не са надраскани, т.е. техните предимства са издръжливост и устойчивост на механично стареене. Друго предимство е, че няма загуба на качество на звука при цифров презапис.

На мултимедийните звукови карти ще намерите аналогов микрофонен предусилвател и миксер.

Цифрово-аналогово и аналогово-цифрово преобразуване на аудио информация.

Нека да разгледаме набързо процесите на преобразуване на звук от аналогов в цифров и обратно. Груба представа за това какво се случва в звуковата карта може да помогне да се избегнат някои грешки при работа със звук.

Звуковите вълни се преобразуват в аналогов променлив електрически сигнал с помощта на микрофон. минава през звуков път(виж приложенията Фигура 1.11, Схема 1) и отива към аналогово-цифровия преобразувател (ADC) - устройство, което преобразува сигнала в цифрова форма.

В опростена форма принципът на работа на ADC е следният: той измерва амплитудата на сигнала на редовни интервали и предава по-нататък, вече по цифровия път, поредица от числа, които носят информация за промените в амплитудата (вижте приложенията Фигура 1.11 , Схема 2).

По време на аналогово-цифрово преобразуване не се осъществява физическо преобразуване. Отпечатък или проба е така да се каже, че се отстранява от електрическия сигнал, който е цифров модел на колебанията на напрежението в аудио пътя. Ако това е изобразено под формата на диаграма, тогава този модел е представен под формата на поредица от колони, всяка от които съответства на определена числова стойност. Цифровият сигнал е дискретен по природа - тоест прекъснат, така че цифровият модел не съвпада точно с аналоговата форма на вълната.

Пробае интервалът от време между две измервания на амплитудата на аналоговия сигнал.

Sample буквално се превежда от английски като "проба". В мултимедийната и професионалната аудио терминология тази дума има няколко значения. В допълнение към период от време, извадка се нарича и всяка последователност от цифрови данни, която е получена чрез аналогово-цифрово преобразуване. Самият процес на трансформация се нарича вземане на проби.На руски технически език го наричат вземане на проби.

Цифровият звук се извежда с помощта на цифрово-аналогов преобразувател (DAC), който въз основа на входящите цифрови данни в подходящите моменти генерира електрически сигнал с необходимата амплитуда (вижте приложенията Фигура 1.11, Схема 3).

Настроики вземане на проби

Важни параметри вземане на пробиса честота и битова дълбочина.
Честота- броя на измерванията на амплитудата на аналоговия сигнал в секунда.

Ако честотата на семплиране не е повече от два пъти честотата на горната граница на звуковия диапазон, тогава загубите ще възникнат при високи честоти. Това обяснява защо стандартната честота на аудио CD е 44,1 kHz. Тъй като обхватът на трептения на звуковите вълни е в диапазона от 20 Hz до 20 kHz, броят на измерванията на сигнала в секунда трябва да бъде по-голям от броя на трептенията за същия период от време. Ако честотата на дискретизация е значително по-ниска от честотата на звуковата вълна, тогава амплитудата на сигнала има време да се промени няколко пъти през времето между измерванията и това води до факта, че цифровият пръстов отпечатък носи хаотичен набор от данни. При цифрово-аналогово преобразуване такава проба не предава основния сигнал, а произвежда само шум.

В новия CD формат Audio DVD сигналът се измерва 96 000 пъти за една секунда, т.е. използвайте честота на дискретизация от 96 kHz. За да спестите място на твърдия диск в мултимедийни приложения, често се използват по-ниски честоти: 11, 22, 32 kHz. Това води до намаляване на звуковия честотен диапазон, което означава, че има силно изкривяване на чутото.

Ако под формата на графика представим един и същ звук с височина 1 kHz (нота до седма октава на пианото приблизително съответства на тази честота), но семплиран с различна честота (долната част на синусоидата е не е показано на всички графики), тогава разликите ще бъдат видими. Едно деление по хоризонталната ос, което показва времето, съответства на 10 проби. Мащабът се взема по същия начин (вж. Приложение Фигура 1.13). Можете да видите, че при 11 kHz има около пет трептения на звуковата вълна за всеки 50 проби, тоест един период от синусоидалната вълна се показва, като се използват само 10 стойности. Това е доста неточно предаване. В същото време, ако вземем предвид честотата на дискретизация от 44 kHz, тогава за всеки период на синусоидата вече има почти 50 проби. Това ви позволява да получите сигнал с добро качество.

Дълбочина на битоветепоказва точността, с която се променя амплитудата на аналоговия сигнал. Точността, с която стойността на амплитудата на сигнала във всеки момент от време се предава по време на цифровизацията, определя качеството на сигнала след цифрово-аналоговото преобразуване. От дълбочината на битовете зависи надеждността на реконструкцията на формата на вълната.

Стойността на амплитудата се кодира с помощта на принципа на двоично кодиране. Звуковият сигнал трябва да бъде представен като последователност от електрически импулси (двоични нули и единици). Обикновено се използват 8, 16-битови или 20-битови представяния на амплитудните стойности. Когато непрекъснат аудиосигнал е двоично кодиран, той се заменя с поредица от дискретни нива на сигнал. Качеството на кодиране зависи от честотата на дискретизация (броя на измерванията на нивото на сигнала за единица време). С увеличаване на честотата на дискретизация, точността на двоичното представяне на информацията се увеличава. При честота от 8 kHz (броят на измерванията в секунда е 8000) качеството на извадения звуков сигнал съответства на качеството на радиоразпръскването, а при честота от 48 kHz (броят на измерванията в секунда е 48 000) - качеството на звука на аудио CD.

Ако използвате 8-битово кодиране, можете да постигнете точност на промяна на амплитудата на аналогов сигнал до 1/256 от динамичния диапазон на цифрово устройство (2 8 = 256).

Ако използвате 16-битово кодиране за представяне на стойностите на амплитудата на аудиосигнала, тогава точността на измерване ще се увеличи 256 пъти.

В съвременните преобразуватели е обичайно да се използва 20-битово кодиране на сигнала, което позволява висококачествено цифровизиране на звука.

Припомнете си формулата K = 2 a. Тук K е броят на всички видове звуци (броят на различните нива или състояния на сигнала), които могат да бъдат получени чрез кодиране на звук с битове

Хареса ли ви статията? Сподели го

Печатна статия