"I" ба "Y" үсэг. Гурван хэмжээст үсгийг өөрийн гараар хэрхэн яаж хийх вэ Хэвлэсэн үсэг th

Хүүхэдтэйгээ 2-р слайд дээрх зургуудыг хар. Ориол, йоги гэсэн үгсийн эхний дууг сонс. Ориол гэдэг үгийн эхний авиа нь [i]. Энэ дууг дуудах үед агаар ямар ч саад тотгор учруулахгүйгээр амаар чөлөөтэй дамждаг. Та үүнийг удаан хугацаанд чирч, дуулж болно. Энэ бол эгшиг авиа юм. Үүнийг I үсгээр тэмдэглэдэг. Йоги гэдэг үгийн эхний авиа нь [th". Аман дахь агаар нь саадтай тулгардаг (хэл нь бидэнд саад учруулдаг). Энэ бол зөөлөн гийгүүлэгч юм. Дуудах үед бид дууг сонсдог. , энэ бол дуут гийгүүлэгч.Энэ авиаг “болон богино” үсгээр тэмдэглэнэ.

Захидлын тухай видеог үзээрэй. Хүүхэдээсээ видео таалагдсан эсэх, юу таалагдсан, юу санаж байсныг асуу. I болон Y үсгийн хооронд ямар ялгаа байдаг вэ?

Дараах слайд дээрх шүлгийг уншина уу. Хүүхэд тань шинэ дуу сонсохдоо алгаа ташихыг зөвшөөр. Слайд 6-г үзнэ үү. I үсэгтэй үгсийг нэрлэ. I үсэгтэй үгээ өөрөө зохио.

10-р слайд дээрх зургуудыг харна уу. "Богино" гэсэн үсэгтэй үгсийг нэрлэнэ үү. 11-р слайд дээрх шүлгийг уншина уу. [th"] авиа нь үгийн дунд эсвэл төгсгөлд байж болно гэдгийг анхаарна уу. Ийм үг гаргаж ирээрэй.

Цомогт байгаа үсгүүдийг бич. Үсэг бүр ямар харагддаг вэ? Та зурган дээрх үсгийг бөглөж болно.

Үсэг бүрийн зурагтай слайдыг хар. Үг бүрийн эхэнд ямар дуу сонсогдож байгааг ярилц. Нэгдүгээр ангийн сурагчдад зориулсан захидал бичих слайд. Амжилт хүсье!

Art-In компани нь дараах системүүдийн цогц шийдлүүдийг санал болгодог. цахилгаан хангамж;цахилгаан тоног төхөөрөмжийн хяналт (гэрэлтүүлгийн хяналт);аудио видео, гэрийн кино театр;аюулгүй байдал, галын дохиоллын систем;CCTV;хандалтын хяналт (домофон);утас, орон нутгийн тооцоолол, телевизийн сүлжээ;үүрэн холбооны дохиог бэхжүүлэх; нэгдсэн удирдлага (Ухаалаг гэр).

Товчхондоо байхгүй

Мөн богино (Y) нь 1918 оны зөв бичгийн дүрмийн шинэчлэлээс хойш бие даасан үсэг болон оршин тогтнож ирсэн. Гэхдээ тэд "Би" гэсэн товч бичгийг нэлээд эрт бичиж эхэлсэн: Би 17-р зуунд, Патриарх Никоны сүмийн шинэчлэлийн үеэр "Бяцхан орос хэл" номноос орос хэл рүү орж, аажмаар сүмийн славян хэлнээс шашингүй орос бичиг рүү шилжсэн. "Кратка" гэдэг нь эртний Грек хэлнээс Латин, Кирилл үсгээр зээлсэн "Бреве" (Латин бреве - "богино") тэмдгийн орос хэлний нэр юм. Брэв нь үсгийн дээгүүр нум шиг харагддаг бөгөөд фонтын мэргэжилтнүүд кирилл үсгийг нумны үзүүрт өтгөрүүлсэн байдлаар нь голд нь зузаан латин брэвээс ялгадаг.

1708 онд Петр I орос цагаан толгойн үсгийг хялбарчлахын тулд иргэний фонтыг нэвтрүүлсэн. Кирилл үсгийн дээд үсгийг халж, товчлолууд ч хутганы доор оржээ. 1735 онд Y-ийн эрхийг сэргээсэн боловч тэдгээрийг тусдаа үсэг болгон хүлээн зөвшөөрөөгүй - толь бичгүүдэд Y-г I-тэй нэгтгэсэн.

19-р зууны төгсгөлд Оросын зөв бичгийн дүрмийг хууль тогтоогч профессор Яков Грот диакритик бүхий I болон E нь огт өөр дуу авиаг илэрхийлдэг гэж гомдолложээ. Ү, Е үсгийг цагаан толгойн үсгүүдтэй эн тэнцүү оруулж, Ү-г “Би богино” биш, “Бас богино” гэж нэрлэхийг санал болгов. Үсгийг амьд ахуйд нь цагаан толгойн үсэгт оруулаагүй боловч нэр нь гацаж, удалгүй цорын ганц үсэг болжээ.

Товчхондоо

Хэл шинжлэлийн мэргэжилтнүүд Y үсгийг илэрхийлж буй авиаг нарийн тодорхойлоход хэцүү байдаг. Эрт дээр үеэс толь бичигт эгшиг гэж нэрлэгддэг байсан бол одоо гийгүүлэгч гэж нэрлэдэг. Баримт нь өөр өөр байрлалд Y нь өөр өөр авиаг илэрхийлдэг: Y нь эгшгийн дараа ирэхэд эгшиг ("май" гэдэг үг шиг), эгшгийн өмнө байвал гийгүүлэгч нь [ёт] (зэрэг) байна. "йод" гэсэн үгээр). Богино I-ийн ийм нарийн төвөгтэй өнгөрсөн үеийг ойлгохын тулд I үсгийн түүхийг санах нь зүйтэй юм. 1918 он хүртэл орос хэл дээр [ба] дууг дамжуулах гурван үсэг байсан. Эхнийх нь - би - гийгүүлэгчийн дараа би шиг сонсогдов (доор). Энэ үсгийг "I аравтын бутархай" гэж нэрлэдэг байсан, учир нь энэ нь 10 гэсэн тоон утгатай тохирч байв. Орчин үеийн кирилл I үсэг Грекийн том eta - Η (дээрх) үсгээс гаралтай. Би үсэг нь Грекийн Η/η, латин Η/h-тэй Финикийн нийтлэг өвөг дээдэстэй байдаг нь сонирхолтой юм. Энэ бол Финикийн Хэт үсэг юм. Дашрамд хэлэхэд тэр [iot] дууг эгшиг хоорондын байрлалд эсвэл үгийн эхэнд дамжуулсан хүн юм: iena, maiorъ. Наймант And (орчин үеийн Анд нь 8 тоон харгалзах тэмдэгтэй) байсан. Мөн Ижица (төв хэсэгт) байсан бөгөөд энэ нь Грекийн upsilon үсгээс гаралтай бөгөөд үүнийг Грекийн эх хувилбартай аль болох ижил төстэй зээл авах зорилгоор нэвтрүүлсэн тул сүмийн нэр томъёонд голчлон бичсэн байв. 1918 онд хийсэн шинэчлэл нь I-ийн хувилбаруудын тоог цөөрүүлж, Латин iota-д орон зай үлдээгээгүй.

Товчхондоо

1918 оны зөв бичгийн дүрмийн шинэчлэл нь шинэ засгийн газар бүх нийтийн бичиг үсгийн сургалтыг зарласнаас хойш иргэдийн амьдралыг хялбарчлах зорилготой байсан гэж үздэг. Шинэ төрийг бүтээгчид энэ шинэчлэлийг хувьсгалаас хамаагүй өмнө Эзэн хааны ШУА-ийн Үсгийн бичгийн дэд хороогоор хэлэлцэж, бэлтгэж, 1912 онд баталж байсныг санахгүй байхыг илүүд үзсэн. Боловсролын Ардын Комиссар Анатолий Луначарскийн зарлигаар 1918 оны 1-р сарын 1-ний өдрөөс эхлэн улсын бүх хэвлэлд шинэ зөв бичгийн дүрмийг тогтоожээ. Бусад зүйлсийн дотор i.-г татан буулгасан. Хуулийн эх бичвэрт Ижицагийн тухай нэг ч үг байдаггүй, гэхдээ тэр үед өөрөө үхэж, тэд үүнийг ашиглахаа больсон. Тиймээс [болон] дууны хувьд зөвхөн нэг үсэг үлдсэн - бидний өнөөг хүртэл ашигладаг үсэг. Шинэчлэлт нь богино I-г тусад нь авч үзээгүй боловч 1918 оноос хойш Y сурах бичигт тусдаа үсэг болгон жагсаасан байна. Мөн 1934 онд "Орос хэлний тайлбар толь бичиг" -д Д.Н. Ушаковын хэлснээр үүнийг Оросын цагаан толгойн нэг хэсэг болгон буцаан тэмдэглэв.

Өнөөдөр хичээл дээр бид зальтай аялагч гэж нэрлэгдэх захидлын тухай ярих болно. Зальтай, учир нь тэр гадаад төрхөөрөө цагаан толгойн хөрштэйгээ маш төстэй, мөн дуу чимээ нь сайн нуугдаж чаддаг. Эрт дээр үед энэ нь манай цагаан толгойн үсгээр гарч ирсэн эсвэл алга болсон, анхандаа үүнийг огт үсэг гэж үздэггүй байсан тул аялагч. Зөвхөн өнгөрсөн зуунд л цагаан толгойн үсгийн I эгшгийн хажууд байнгын байр суурьтай болсон. Энэ бол Y үсэг (I богино) ба [th'] авиа юм. Заримдаа түүний илэрхийлж буй дууг "йот" гэж нэрлэдэг. Тэгвэл яагаад бидэнд цагаан толгойн өөр I үсэг хэрэгтэй болов? Эхлээд [i] дууны шинж чанарыг санацгаая. Дуу [болон] эгшиг, энэ нь сунадаг, дуулж байна. Одоо [th'] дууг дуулж үзээрэй. Бүтээгүй юу? Мэдээжийн хэрэг, энэ нь богино гийгүүлэгч учраас. Энэ нь манай цагаан толгойн эгшиг [ба] ба гийгүүлэгч [th'] нь огт өөр үүрэг гүйцэтгэдэг тул бидэнд хоёулаа хэрэгтэй бөгөөд чухал гэсэн үг юм. Өнөөдөр бид Y үсгийн зөвхөн нэг бүтээлийн тухай ярих болно.

[th'] дууны тодорхойлолтоос эхэлцгээе. Гараа хоолой эсвэл чихэндээ тавиад [th'] дууг дууд. Бид чичиргээг мэдэрсэн бөгөөд энэ нь дуугарах чимээ гэсэн үг юм. Одоо энэ дууны өөр нэг заль мэхийг санаарай: [th'] дуу нь зөвхөн зөөлөн бөгөөд хатуу хосгүй байна. Энэ нь [th'] дуу нь гийгүүлэгч, аятай, зөөлөн гэсэн үг юм. Одоо энэ дуу авиаг үгээр таних дадлага хийцгээе.

Өнөөдөр бид шувууны хаант улс руу явах болно. Оньсого тааж, үгэнд байгаа авианы газрыг нэрлээрэй: үгийн эхэнд, дунд эсвэл төгсгөлд.

Чиг-жиргээ!

Үр тариа руу үсрээрэй!

Пек, бүү ич!

Энэ хэн бэ?

Бор шувуу- үгийн төгсгөлд [th’] дуугарна (Зураг 1).

Цагаан далавчтай шувуу

Далайн дээгүүр нисдэг.

Тэр загасыг харах болно -

Хушуу нь хангалттай.

Чайка - үгийн дундах [th'] дуу (Зураг 2).

Тэмдэглэлгүй, хоолойгүй хэн байна

Тэр хамгийн сайн трилл гаргадаг,

Хариулт...

Nightingale- үгийн төгсгөлд [th’] дуугарна (Зураг 3).

Бяцхан саарал шувуу

Жижиг шувуу,

Та үргэлж хүзүүгээ хөдөлгөдөг.

Ингэх шаардлага байна уу?

Хүзүү- үгийн дундуур [th’] дуугарна (Зураг 4).

Цагаан будаа. 4. Орой хүзүү ()

Шувууны баяр баясгалантай урам зоригоор,

Амжилтанд бат итгэлтэй,

Ямар шувуу далайд шумбдаг вэ?

Ямар ч эргэлзээгүйгээр, хамгийн шилдэг нь?

Гильемот- үгийн дундуур [th’] дуугарна (Зураг 5).

Энэ бол солонго биш, дөл ч биш!

Ямар шувуу вэ? Таагаарай!

Тэр бидэнтэй өдөржин чатладаг

Олон өнгийн…

Тоть- үгийн төгсгөлд [th’] дуугарна (Зураг 6).

Би хийх зүйлгүй амьдрах дургүй,

Би таван цагт босдог,

Дараа нь би хушуугаараа хуш мод тарьж,

Эдгээр нь гүн ойн царс юм.

Жэй- үгийн дунд байрлах [th’] дуу (Зураг 7).

Бүс нутгийн хэмжээнд дуу чимээ, чимээ шуугиан,

Шувууд айсандаа гүйж байна.

Тэнгэрт махчин амьтан гарч ирэв,

Идэх юм хайж байна.

Хоук- үгийн эхэнд [th’] дуугарна: [yastr’ip] (Зураг 8).

Үгийн эхэнд нэг л удаа [й’] авиа гарч ирснийг бид анзаарсан. Баримт нь энэ дуу чимээ нь орос хэлний үгсэд ховор тохиолддог. Манай хэлэнд Y үсгээр эхэлсэн үг цөөхөн байдаг бөгөөд тэдгээрийн дотор газарзүйн нэрс голчлон байдаг, гэхдээ зөвхөн биш. Y үсгээр эхэлсэн үгсийг нэрлэж үзээрэй.

Хүүхэд бүр йодыг мэддэг.

Ээж нь шарханд иод түрхдэг(Зураг 9) .

Бүх хүүхдэд ямар сүүн бүтээгдэхүүн уух ёстой вэ? Тараг (Зураг 10).

Иогч хэзээ ч “Өө!” гэж хэлэхгүй.

"Өө өө!" - йогч хашгирахгүй(Зураг 11) .

Залуу минь, өөрийгөө захир!

Хөгшин, залуу шиг бай!

Yorkshire Terrier, эсвэл York (Зураг 12).

Цагаан будаа. 12. Йоркшир терьер ()

Y үсэг хэрхэн бичигдсэнийг харцгаая.

Учир нь таслал

Тэр түүний мөрөн дээр сууна.

Блок үсгийг анхаарч үзээрэй. Тэд танд юуг сануулж байна вэ? Захидал II.

Y үсгийг I богино гэж нэрлэдэг.

Тэмдэглэлийн дэвтэрт би дуртай.

Y-г би-тэй андуурахгүйн тулд,

Дээд талд тэмдэг бичнэ үү.

Үсрэх-үсрэх баар

Тэгээд тэр диагональ байдлаар хэвтэв.

H дотроо өөрчлөгдсөн,

Үр дүн нь I үсэг юм.

Тэгээд I үсгийн дээр

Шувуу хажуугаар нь нисэв

Y (I богино) үсэг I болно

Би шууд л хүссэн.

Y үсэг ямар харагддаг вэ?

Босоод дэнлүүний доор

Бид түүнийг танихгүй.

Өөрчлөгдсөн - хараарай

Түүнийг нууцаар харж байна.

Өмнө нь зөвхөн би байсан

Одоо Y (би богинохон).

Зохиолч Виктор Хмельницкий өөрийн гэсэн түүхийг бүтээжээ.

Өмнө нь Ү, Ү үсэг нь бие биенээ зочлохыг урьдаг байсан бол Y үсэг нь коридорт үргэлж саваа үлдээдэг байсан бөгөөд Y үсэг нь үүнийг зөөлөн тэмдэгээс ялгаж чаддаггүй байв. Тэгээд Ү үсэг зочлохоор ирэхдээ малгайгаа өлгүүрт үлдээж, гэрийн эзэгтэй зочноо И үсэгтэй андуурч эцэст нь тэд энэ будлианаас залхав. Цай яах вэ? Тэгээд одоо тэд цэцэрлэгт цай ууж байна. Ү үсэг нь шидэт саваагаа өөртөө хадгалдаг бөгөөд Y үсэг нь малгайг нь тайлж болохгүй(Зураг 13) .

Цагаан будаа. 13. Ү, Ү үсгийн тухай үлгэр

Y авиа ба үсэг нь "аль нь вэ?" Гэсэн асуултанд хариулах дуртай. Шалгацгаая. Зургийг хараад надад хэлээрэй.

Аль зулзага (Зураг 14) вэ?

Улаан, жижиг, хөгжилтэй, зөөлөн гэх мэт.

Ямар үүргэвчтэй байх вэ (Зураг 15)?

Сургууль, шинэ, хүнд, үзэсгэлэнтэй гэх мэт.

Цагаан будаа. 15. Сургуулийн үүргэвч ()

Ямар төрлийн тарвас (Зураг 16) вэ?

Судалчлагдсан, чихэрлэг, элсэн чихэр, амттай гэх мэт.

Дараах үгсийг уншъя. өө, өө, хөөе- Энэ нь мэдрэмжийг илэрхийлэхэд тусалдаг.

Нэг үсгийг нэг үгээр орлуулснаар бид өөр үг авна. май - хуцах - диваажин - сүрэг - миний.

[th'] дуу үргэлж зөөлөн байдаг. Тиймээс Y үсэг нь үргэлж зөөлөн байдаг [й’] авиаг, I эгшиг нь өмнөх гийгүүлэгчийн зөөлөн байдлыг илэрхийлдэг.

Бичсэн Ү үсгүүдийг харцгаая (Зураг 17, 18).

Хараач, хараач,

Хайрт найз,

Юу хүртэл?

Бид адилхан!

Бидэнд нийтлэг зүйл байдаг

Чи надтай адилхан

Тэгээд би чам шиг.

Бид дэгдээхэй шиг харагдаж байна.

Магадгүй бид ихрүүд юм болов уу?

Цагаан будаа. 17. Бичсэн болон хэвлэсэн үсэг I ()

Цагаан будаа. 18. Бичсэн болон хэвлэсэн Ү үсэг ()

Ялгаа нь юу вэ? Y дээр нь хачиг эсвэл шувуу байна.

Y үсгийг бичих дасгал хий.

Одоо дараах даалгаврыг гүйцээцгээе: шүлгийг сонсож, бүх дууг [th'] Ү үсгээр бичээрэй. Санамж: үсэг байгаа тооны дуу.

Миний өрөөний хажууд

Тэнд маш олон найзууд байдаг:

цагаан гаа,

Саарал,

судалтай,

Мөн далавчгүй

Мөн далавчтай

Мөн эвэргүй

Мөн эвэртэй,

Мөн сүүлгүй

Мөн сүүлтэй ...

Та хэдэн захидал авсан бэ? 9. Та ойд амьдардаг ямар амьтдыг төсөөлж байсан бэ? Надад хэлээч.

Одоо богино хэмжээний диктант бичье.

"Рома" гэдэг үгийн эхний авиаг төлөөлж буй үсгийг бич.

"Залхуу" гэдэг үгийн сүүлчийн дууг илэрхийлэх үсгийг бич.

“Ой” гэдэг үгийн хоёр дахь авиаг илэрхийлэх үсгийг бич.

Том үсгээр N бичнэ үү.

Өнөөдрийн хичээлийн том үсгийг бич.

Цагаан будаа. 19. Өөрийгөө сорих

Гэрийн даалгавар

1. Том жижиг Ү үсгийг загалмайгаар бичих дадлага хий.

2. Нэр нь Ү үсэг агуулсан 5 үлгэрийг санаж, нэрлэ.

3. Ой, Ай хоёрын тухай богино өгүүллэг бичээрэй.

Ном зүй

1. Андрианова Т.М., Илюхина В.А. Орос хэл 1. - М.: Астрель, 2011.

2. Бунеев Р.Н., Бунеева Е.В., Пронина О.В. Орос хэл 1. М.: Баллас, 2012

3. Агаркова Н.Г., Агарков Ю.А. Бичиг үсэг, унших заах сурах бичиг: ABC. Эрдмийн ном/сурах бичиг, 2014 он

1. "Нээлттэй хичээл" сурган хүмүүжүүлэх санааны наадам ()

Сүүлийн зургаан сарын хугацаанд интернет зүгээр л "th" үсгээр дүүрсэн. Би түүнтэй мэдээллийн сайтууд, шуурхай мессенжерүүд, Habrahabr, geektimes сайтуудаар уулзсан. "Бид юу яриад байгаа юм бэ?" - чи асууж байна - "Би ердийн у үсгийг харж байна!" Ямар оноо вэ. Би үүнийг ингэж харж байна:



Хэрэв та "y" үсэг нь "жинхэнэ" "y" шиг харагддаг азтай хүмүүсийн нэг бол танд нэг заль мэх байна: үүнийг ("y" үсгийг) Notepad руу хуулж, курсорыг үсгийн төгсгөлд байрлуул. үсэг болон backspace товчийг дарна уу. Ид шид, сэтгэл хөдөлгөм!
Энэ яаж болдог вэ?

Графим, глиф, кодын цэг, байршил, байт

Маш товч танилцуулга:
Графем гэдэг нь бид бичвэрийн нэгж гэсэн утгаараа үсэг гэж нэрлэж заншсан зүйл юм. Глиф нь графикийн нэгж бөгөөд графемийг өөрөө эсвэл түүний хэсгийг графикаар илэрхийлж болно (жишээлбэл, янз бүрийн диакритик: өргөлт, умлаут, е үсгийн дээд цэгийн хоёр цэг гэх мэт).
Код цэг нь текстийг Юникод дүрслэлд хэрхэн бичихийг хэлнэ. Нэг графемыг өөр өөр кодын цэгүүдээр бичиж болно.
Кодын цэгүүдийг стандартаас хамааран өөр өөр байт дүрслэлээр кодлодог: UTF-8, UTF-16, UTF-32, BE, LE…
Програмчлалын хэл нь ихэвчлэн кодын цэгүүдтэй ажилладаг; Хүмүүс бид дүрсээр сэтгэх нь элбэг.

Эцэст нь th гэсэн үсгээ ойлгоцгооё. Энэ юугаараа онцлог вэ?
Энэ үсэг нь нэг графем (“ба” товчоор) боловч хоёр кодын цэгээр бичигдсэн болно:
U+000438 КИРИЛ ЖИЖИГ ҮСГЭЭ I U+000306 ХОСОЛТОЙ БРЕВ
Хэрэв та буцах товчийг дарж заль мэхийг хийсэн бол та зүгээр л COMMINING BREVE буюу эгшгийн дээрх товчлолын дүрсийг арилгана.

Бид бүгдээрээ гар дээр бичиж дассан "ба" гэсэн богино үсэг нь нэг кодын цэгээр бичигдсэн нийлмэл тэмдэгт юм.
U+000439 КИРИЛ ҮСГИЙН ЖИЖИГ ҮСГИЙН ТОВЧООН I
Диакритикийг харуулах нь фонт болон дүрслэгчээс хамаарна. Жишээлбэл, энэ нийтлэлийн засварлах цонхонд тэмдэг нь зөв харагдах боловч харвал хөдөлдөг. Зарим фонтууд диакритикийг нийлмэл тэмдэгтээр тусад нь харуулах боломжтой.

Энэ яагаад муу юм бэ?

Бүх программууд биш, тэр ч байтугай вэбсайтууд нь кодын цэгүүдийг өөр өөр кодын цэгүүдээр бичигдсэн ижил глифүүдийг харьцуулах боломжийг олгодог хэлбэрт хувиргаж чаддаггүй. Өөрөөр хэлбэл, програм, вэбсайт бүр "th" болон "th"-ийг нэг тэмдэгт гэж хүлээн зөвшөөрдөггүй бөгөөд энэ нь жишээлбэл, ийм үсгийг ашиглан хайх боломжгүй болгодог.

Жишээлбэл, та холоос хайх шаардлагагүй: geektimes дээрх хулганын тоймтой харьцангуй саяхан гарсан нийтлэл, дэлгэцийн агшинг дээрх нийтлэлд өгсөн болно. Өгүүлэлд байгаа бололтой дараах хэллэгийг Google-ээс хайцгаая.
Хэн ч таныг "хоосон" профайл үүсгэхэд саад болохгүй

Нийтлэл нь хоёр дахь үр дүн бөгөөд тодоор бичсэн хэсгээс харахад бид бүрэн тексттэй тохирч байна. Гайхалтай, бид үүнийг нээж, хуудаснаас ижил текстийг хайж олохыг оролдоод Firefox юу ч олсонгүй.

Geektimes дээр хийсэн хайлт нь ямар ч холбогдох илэрцийг олохгүй:

Гэхдээ нийлмэл "th"-ийг задарсан ах "th"-ээр солих үед бүх зүйл байрандаа орно.

Google хайлтын асуулгыг ямар нэгэн байдлаар өөрчилсөн нь танд кодын цэгээр бус глифээр хайх боломжийг олгож байгаа бололтой.
Хэрхэн ажилладаг?

Хэвийн байдал

Юникод хэвийн болгох стандарт нь хоёр тэмдэгтийн эквивалентыг тодорхойлдог: Каноник ба нийцтэй байдал. Эхнийх нь ижил глифүүдийг өөр өөр кодын цэгүүдтэй харьцуулах боломжийг олгодог бөгөөд хоёр дахь нь тэдгээрийг хялбаршуулсан аналогуудтай харьцуулах боломжийг олгодог - ½ нь 1/2, ℌ H гэх мэт.

Мөн 4 төрлийн хэвийн байдал байдаг:

  • Нормалжуулах маягт D (NFD)- каноник задрал. cześć (Польшоор сайн уу) гэснийг c, z, e, c + ´, s + ´ гэж задлаарай.
  • Нормалжуулах маягт C (NFC)- өмнөх хувилбарт заасан зүйлийг цуглуулах болно.
  • Хэвийн маягт KD (NFKD)- нийцтэй байдлын задрал. ½-ийн 1/2, 2⁵-ийн 25-ыг хийнэ.
  • Хэвийн маягт KC (NFKC)- Өмнө нь тавьсан зүйлийг цуглуулахыг хичээх болно.
Хэрэв бид Habrahabr шиг сайтын талаар ярих юм бол нийтлэхээс өмнө бүх нийтлэлийг NFC-ээр хэвийн болгох, хайлтын асуулгад NFKD боловсруулалт хийх нь зүйтэй юм.

Жишээлбэл, Python дээр үүнийг unicodedata модулийн тусламжтайгаар хийж болно.

Нуугдсан текст

импортын систем
Unicodeta-г импортлох
хэвлэх(unicodedata.normalize("NFKD", sys.argv))

% python unicode.py cześć | hexdump -C
00000000 63 7a 65 73 cc 81 63 cc 81 0a |czes..c...|
% echo "cześć" | hexdump -C
00000000 63 7a 65 c5 9b c4 87 0a |цзе.....|

Дүгнэлт

RuNet-д "th" гарч ирэхэд хэн буруутайг би бүрэн тодорхой хэлж чадахгүй ч Google Docs-д сэжиг төрж байна. Аз болоход алдаа зассан бололтой, учир нь... Би 3 долоо хоногийн турш мөлхөж буй шортыг харах шаардлагагүй болсон.

Глифтэй холбоотой асуудал офлайн үед ч гардаг. Энд "е" үсэгтэй жинхэнэ паспортын зураг байна (КИРИЛ ЖИЖИГ ҮСГЭЭ IE + ХОССОН DIERESIS)

Хуваалцах: