@Shumaher
Shumaher
26 Jan 2016

слил дамп базы с хостинга в кодировке 1252 (судя по Декодеру Лебедева), не получается перекодировать в UTF-8, ибо
iconv -f WINDOWS-1252 -t UTF-8 ./file.sql
не работает.
enca тоже не работает, например.
не ожидал, что в этом будет проблема. как сделать?

26 Jan 2016

А iconv её разьве не cp1251 называет?

26 Jan 2016

1252 это восточно-европейские, кажется. Русская винда 1251 и, в клиническом случае, 866

26 Jan 2016

именно 1252, винда вообще не при чем тут

#icayd/3 в ответ на /2
26 Jan 2016

Shumaher, мне кажется посмотреть кодировку в file file.sql чуточку надёжнее, чем в декодере Лебедева. А ещё лучше посмотреть настройки базы, откуда сливал.

26 Jan 2016

file вообще пишет, что это HTML, и больше ничего
а декодер Лебедева кодирует-таки правильно. но я не хочу ему весь дамп кормить

#icayd/5 в ответ на /4
26 Jan 2016

он не падает, а тупо не исправляет ничего. крякозябры выглядят по-другому только)

#icayd/7 в ответ на /6
26 Jan 2016

Shumaher, а file -bi file.sql тоже говорит, что HTML без кодировки? Я бы попробовал поменять параметры у iconv.

#icayd/8 в ответ на /7
26 Jan 2016

"text/html; charset=utf-8" так пишет.
так а какую еще кодировку выбирать тогда?

#icayd/9 в ответ на /8
26 Jan 2016

Shumaher, а у тебя остался доступ к базе? Что у базы за кодировка? Странно, если она и впрямь 1252, а сервер не восточно-европейский!

#icayd/10 в ответ на /9
26 Jan 2016

нет. сама база в UTF-8, но бэкап отдаётся такой

#icayd/11 в ответ на /10
26 Jan 2016

Shumaher, ещё насколько я понял, в базе может оказаться смешанная кодировка (особенно если есть какой-то пользовательский ввод). Это бы объяснило, почему декодер лебедева жрёт небольшой кусок, а iconv не жрёт весь файл. Можно попробовать посплитить файл, скажем, на десятипроцентные куски, и попробовать декодировать каждый отдельно. Если какие-то декодируются, а какие-то нет — найдёшь в них проблему.

#icayd/12 в ответ на /11
26 Jan 2016

Типа

split -l 500 file.sql sqlchunk-
#icayd/13 в ответ на /12
26 Jan 2016

вряд ли смешанная. CMS работает нормально, и не могло такого быть. и бэкапы например из PMA работают потом тоже норм. проблема, мне думается, тупо в этом кривом дампе

#icayd/14 в ответ на /12
26 Jan 2016

Shumaher, тогда, может, просто слить его снова?

#icayd/16 в ответ на /14
26 Jan 2016

уже несколько раз сливал. там видимо такой дебильный скрипт и ничего с этим не поделать

#icayd/17 в ответ на /16
26 Jan 2016

Shumaher, ну, я бы таки попробовал посплилить тогда. Или хотя бы первый кусок, который ты скармливал лебедеву, скормить в iconv с твоими опциями и посмотреть, разжуёт или нет. Если разжуёт, то таки сплитить.

#icayd/18 в ответ на /17
26 Jan 2016

я лебедеву одно слово только скормил)

#icayd/19 в ответ на /18
26 Jan 2016

Shumaher, а чё если импортнуть этот дамп в пустую базу? Добавив опций по вкусу. И потом снова экспортнуть в utf-8.

#icayd/20 в ответ на /17
26 Jan 2016

хммм, об этом я чето не подумал, ща попробую так

#icayd/21 в ответ на /20
26 Jan 2016

isqua, или устроить бинарный поиск с помощью head и tail :)

#icayd/15 в ответ на /12
26 Jan 2016

да ничо пока что. через PMA не вышло, чуть позже через консоль попробую

#icayd/23 в ответ на /22

Добавить пост

Вы можете выбрать до 10 файлов общим размером не более 10 МБ.
Для форматирования текста используется Markdown.