Упёртость линукс-разработчиков иногда раздражает.
Два примера.
Пример 1 - pidgin. Симпатичный GTK-шный ICQ-и-много-чего-ещё-клиент, удобный и быстрый. Проблема одна - кодировки. Дело в том, что в ICQ-протоколе нет стандартной кодировки сообщений. Вроде как когда-то была установлена в качестве таковой UTF-8, но разработчики клиентов под Windows на это плюют - они знают только cp1251. Аська-онлайн (общение с сайта) работает наоборот как раз на UTF. В итоге имеем кракозябры в сообщениях. Разработчики нормальных клиентов - Miranda, SIM, Kopete - давно уже сделали индивидуальную настройку кодировки для каждого пользователя. Приходят тебе от кого-то кракозябры - подбери правильную кодировку и живи спокойно. Разработчики Pidgin - упрямы. Ни в одном релизе НЕТ индивидуальной настройки кодировки. Можно настроить кодировку для всего ICQ-аккаунта, одну, общую. Всё. На форумах по этому поводу ответ один: "ICQ- дерьмовый протокол! Им не нужно пользоваться!" Не "Мы - говнопрограммеры, упрямые как ослы", а именно так. В каком мире они живут? Они что, реально надеются, что либо Linux-пользователи уйдут в Jabber-резервацию и порвут все общение с классово чуждыми виндузятниками, либо протокол ICQ будет побеждён, и каждому рядовому windows-юзеру явится с небес видение о великом могуществе Jabber? Так ведь не будет этого никогда!
Пример 2 - аналогичный. Музыкальный проигрыватель AmaroK. Очень хорошая программа, с массой возможностей, стыкующаяся с mp3-плеерами, связывающаяся с интернетом в поисках информации о треке, исполнителе и т.д... В общем - аналог iTunes в некотором роде. Но! В формате mp3 предусмотрены тэги. И по стандарту заполнение тэгов производится в - угадали! - кодировке UTF-8. Каковую и поддерживает AmaroK. А вот WinAmp - массовая программа у Windows-пользователей - заполняет тэги в кодировке cp1251. В какой кодировке закодированы тэги в 99% композиций формата mp3 в русскоязычном пространстве? Угадали. В ней самой. Как вы думаете, AmaroK поддерживает на чтение какую-либо альтернативную кодировку для тэгов? Нет. Потому что стандарт. Оставим в стороне разработчиков WinAmp, которые упорно не следуют стандарту. Но почему поддержка других кодировок в AmaroK БЫЛА до некоторой версии, а потом ИСЧЕЗЛА? И теперь, если у тебя коллекция mp3 с кириллическими тэгами - то надо либо любоваться на кракозябры, либо перекодировать всё в UTF (и тогда кракозябры будут в других плеерах), либо устанавливать специальные библиотеки от xmms-плеера, написанные совершенно не имеющей отношения к AmaroK командой разработчиков...
Вот может кто-нибудь мне это разумно объяснить?
Два примера.
Пример 1 - pidgin. Симпатичный GTK-шный ICQ-и-много-чего-ещё-клиент, удобный и быстрый. Проблема одна - кодировки. Дело в том, что в ICQ-протоколе нет стандартной кодировки сообщений. Вроде как когда-то была установлена в качестве таковой UTF-8, но разработчики клиентов под Windows на это плюют - они знают только cp1251. Аська-онлайн (общение с сайта) работает наоборот как раз на UTF. В итоге имеем кракозябры в сообщениях. Разработчики нормальных клиентов - Miranda, SIM, Kopete - давно уже сделали индивидуальную настройку кодировки для каждого пользователя. Приходят тебе от кого-то кракозябры - подбери правильную кодировку и живи спокойно. Разработчики Pidgin - упрямы. Ни в одном релизе НЕТ индивидуальной настройки кодировки. Можно настроить кодировку для всего ICQ-аккаунта, одну, общую. Всё. На форумах по этому поводу ответ один: "ICQ- дерьмовый протокол! Им не нужно пользоваться!" Не "Мы - говнопрограммеры, упрямые как ослы", а именно так. В каком мире они живут? Они что, реально надеются, что либо Linux-пользователи уйдут в Jabber-резервацию и порвут все общение с классово чуждыми виндузятниками, либо протокол ICQ будет побеждён, и каждому рядовому windows-юзеру явится с небес видение о великом могуществе Jabber? Так ведь не будет этого никогда!
Пример 2 - аналогичный. Музыкальный проигрыватель AmaroK. Очень хорошая программа, с массой возможностей, стыкующаяся с mp3-плеерами, связывающаяся с интернетом в поисках информации о треке, исполнителе и т.д... В общем - аналог iTunes в некотором роде. Но! В формате mp3 предусмотрены тэги. И по стандарту заполнение тэгов производится в - угадали! - кодировке UTF-8. Каковую и поддерживает AmaroK. А вот WinAmp - массовая программа у Windows-пользователей - заполняет тэги в кодировке cp1251. В какой кодировке закодированы тэги в 99% композиций формата mp3 в русскоязычном пространстве? Угадали. В ней самой. Как вы думаете, AmaroK поддерживает на чтение какую-либо альтернативную кодировку для тэгов? Нет. Потому что стандарт. Оставим в стороне разработчиков WinAmp, которые упорно не следуют стандарту. Но почему поддержка других кодировок в AmaroK БЫЛА до некоторой версии, а потом ИСЧЕЗЛА? И теперь, если у тебя коллекция mp3 с кириллическими тэгами - то надо либо любоваться на кракозябры, либо перекодировать всё в UTF (и тогда кракозябры будут в других плеерах), либо устанавливать специальные библиотеки от xmms-плеера, написанные совершенно не имеющей отношения к AmaroK командой разработчиков...
Вот может кто-нибудь мне это разумно объяснить?

Comments
Ja vot uje mesiats obshajus s rebiatami iz Parsixa - ochen milo. :-)
Вообще UTF8 используется в тех случаях, когда хочется поддерживать любую кодировку. Вот браузерная игрушка, регион пользователей не ограничен, названия игровых сущностей хранятся и отображаются с использованием UTF8 -- в итоге на одной странице (и даже в одном названии) можно видеть рядом китайские иероглифы (именно иероглифы, а не краказябры :), европейские умляуты и кириллические символы. Но для этого, разумеется, нужно приложить усилия разработчикам, чтобы читать, сохранять и выводить текст без потерь кодировки.
Кстати, вот тут очень хорошая статья: короткий ликбез про кодировки.
Проблема в том, что что в html кодировку указать можно, а в сообщении icq нельзя. Можно либо угадать, либо знать заранее. Конечно, авторы протокола заслуживают не меньшего порицания. Конечно, программисты, написавшие нестандартные клиенты заслуживают большего порицания. Но упёртость упомянутых Чижиком товарищей непонятна: вроде бы это не так и сложно сделать, так в чём проблема?
Авторы протокола, кстати, поступили как раз совершенно верно. Поскольку ICQ-протокол предполагался к использованию по всему инету, юзерами с разными наборами символов -- UTF8 был идеальным решением (см. выше: это способ закодировать любой символ любой кодовой страницы). И то, что большинство windows-климентов его не поддерживают, это действительно неправильно, но это факт, с которым сейчас приходится жить. Так что я тоже не понимаю той упертости.
Еще могу привести в пример 4 винампообразных плейера(xmms, bmp, audocious, qmmp), каждый из которых не является полноценной заменой winamp-у. Каждому требуется доработка напильником. И все равно не получается полноценной замены - в xmms проблемы с кодировками, в bmp мало подключаемых модулей, умеет играть только mp3, ogg, wav, cda, в audacious кривая поддержка midi и wav(!!!), а также mp3 с плавающим битрейтом, qmmp просто сырой и часто вываливается.
А с jabber все же понятно - чем меньше подерживают icq тем больше народу переползает на жаббер ;)
Зато удобно: приходит спам из вопросиков --- и почти не раздражает.
Если и у него нет -- то я как минимум не удивлён. Ибо где нет кириллицы этих проблем просто не возникает.
Кстати про mp3-теги ИМХО правильнее не подгоняться под непонятно что, а перекодировать теги в массовом порядке, благо это можно сделать массово и ненапряжно... Кажется когда я последний раз жил на вин-32, плееры, которые я использовал, читали юникод без каких-либо проблем...