Andrey
Какая разница? У тебя сразу размер в буквах. Сколько байт на букву — пофиг, такая точность не нужна, нужен порядок
Ошибка может быть до х4, если не учитывать размер символа в байтах. Тебе же тут все расписали.
Andrey
Делить точно не надо :)
Анатолий
Он прав?
Всё зависит от кодировки. Если utf8 или любая из старых кодировок - ничего делить и умножать не надо. Если вдруг utf16 - то надо умножить на два. Но это если в книге спецсимволы из utf16, которых на клавиатуре вообще нет. Редко, но бывает такое :)
Анатолий
☕️ Паша ☭👨🏻‍🔧
utf8 больше 1251 в 2 раза
Анатолий
utf8 больше 1251 в 2 раза
Почему? Там же 8 бит на символ в обоих
Нехис
Нет. Всего процентов 18 иероглифами и еще примерно столько же индийской письменности (если конечно предположить что все там хотя бы минимально грамотные)
Анатолий
Юникод - это просто стандарт. От его реализации зависит количество байт на символ. Есть utf-8, utf-16, даже utf-32
Aragaer
в utf-8 есть разница между "первым байтом" и continuation byte
Aragaer
по первому биту можно сказать является ли он первым байтом или же продолжением предыдущего символа
Aragaer
все аски в нем укладываются в один байт, а подавляющее большинство "не-иероглифов" - в два. Иероглифы - в 3-4.
Aragaer
А в utf-16 многие иероглифы укладываются в 2 байта, поэтому те, кому нужны иероглифы, любят utf-16
Aragaer
а что именно надо посчитать?
Анатолий
Я вот зайду в блокнот, наберу текст, сохраню - он будет занимать 10 килобайт. Пересохраню в utf-32 - станет занимать 40 килобайт, тот же текст
Анатолий
Но utf-32 узкоспецифическая, её для вёрстки не используют :) Можно считать или байт на символ, или два байта если с иероглифами
Andrey
Если не знать кодировки
если не знать, какие символы используются. Как уже выше писали, символы в utf-8 могут занимать от 1 до 4 байт
ARTi
а что именно надо посчитать?
Сколько весят 650к страниц текста для суда.
Aragaer
плейнтекст или какой-нибудь формат документов?
Анатолий
Вообще нужна конкретика - какой текст, на каком языке
Andrey
наши в utf-8 2 байта. В cp1251 - 1
Анатолий
Вот, всё зависит в какой кодировке сохранить. Блокнот по умолчанию сохраняет в 1251
Анатолий
Поэтому если будут сохранять в текстовик, то скорее всего это будет блокнот, 1251 и жёстко 1 байт на символ
Andrey
а мы же еще сжатие не учитывали! %)
☕️ Паша ☭👨🏻‍🔧
и зачем я всё расписывал раньше...
ARTi
а для чего этот рассчет?
В статье написали что пришлось распечатать потому что электронная почта не может принять такой объем текста.
Andrey
а выложить куда-нибудь и послать ссылку?
Анатолий
ARTi
и зачем я всё расписывал раньше...
Чтоб было на кого ссылаться если что))
ARTi
а выложить куда-нибудь и послать ссылку?
Так похоже нельзя правилами
Анатолий
В статье написали что пришлось распечатать потому что электронная почта не может принять такой объем текста.
Так видимо отправляли не текстовым вложением, а прямо в почтовый клиент пытались вбить 😂
Анатолий
Понятное дело, он повесился, даже сраный блокнот на одном мегабайте уже подыхает
Анатолий
На вложения ограничения есть
Там такие ограничения, что "Войну и Мир" в нескольких экземплярах переслать можно
Aragaer
да его любой архиватор сожмет в сотни раз
Анатолий
Это если отправить её чистым текстом, без сжатия :)
Анатолий
Что-то мутят
Анатолий
Вроде 30 мегов
А Война и Мир 3 метра весит
Анатолий
Или действительно пытались скопировать и вставить текст прямо в окно почтового клиента
ARTi
А Война и Мир 3 метра весит
Сколько страниц а4?
Анатолий
Тогда конечно понятно, всё подохло :) Но это не называется "электронная почта не может принять такой объем текста". Это называется "мы не умеем пользоваться электронной почтой".
Анатолий
Сколько страниц а4?
Зависит от того, насколько плотно набивать, каким кеглем, расстояние между строками, отступы с боков
ARTi
https://www.faz.net/aktuell/wirtschaft/unternehmen/lastwagen-mit-daimler-klage-erreicht-anwaelte-16252012.html
ARTi
В суд дело
Анатолий
Сколько страниц а4?
Ну допустим 1000, если с двух сторон печатать
Анатолий
Анатолий
Ну если прикинуть - 100 листов на сантиметр, то 650к получится стопка высотой 6 с половиной метров
Анатолий
Нормальное такое дело 😱
ARTi
Как его читают и ищут там текст я без понятия
Анатолий
Сколько ж они его печатали... ))
Анатолий
Те 650к страниц в утф8 будут весить 650к стр/200 стр на мег =3250 мегов= 3 гб?
Ну посчитаем. Возьмём для примера 1800 знаков на лист - это стандарт авторского листа в РФ. 650 тысяч листов - 1.17 миллиардов знаков
Анатолий
Мне уже интересно, кто отважился набрать весь этот текст. Если 300 символов в минуту херачить - то получится надо 30 лет сидеть и набирать текст с учётом рабочего дня, сна и выходных.
ARTi
Сколько ж они его печатали... ))
Возможно там копипасты законов
Анатолий
Считаем дальше :) 1.17 миллиардов знаков - примерно 1 гигабайт если в обычной кодировке. Если в utf-16 - то 2 гигабайта
Анатолий
Есть алгоритмы архивации, которые могут сжать 1 гигабайт текста до 25 мегабайт.
Анатолий
С двумя уже будет упс
Павел
Вроде 30 мегов
Зависит от сервера
Анатолий
Но! архиваторы умеют разбивать на томы. Можно отправить несколько архивов несколькими письмами
Анатолий
Тогда даже винрар на максимуме справится
Анатолий
С кодировкой в бейз 64
Каждый печатный символ нарисовать и эту картинку зашифровать в бейз64 ))
Анатолий
И тогда нужно будет домножить на 200-300 примерно. Ну то есть получится пол терабайта текста, переведённого в картинки и зашифрованного в BASE-64 )
Анатолий
100 камазов текста
Анатолий
О! можно ж было весь текст закатать на болванки и перевезти не бумагу, а эти болванки
Анатолий
На одну! единственную болванку DVD-R. Ну конечно с base-64 вышло бы 10 болванок, какое огорчение ))
Анатолий
И если камазы забить не бумагами, а болванками, то скорость передачи данных заметно возрастёт ))
☕️ Паша ☭👨🏻‍🔧
Инструктаж Сегодня на работе старый электрик учил молодого: - Если силовой кабель лежит на земле, а ты не знаешь, под напругой он или нет, подходи медленно, широкими шагами. - Учили ж маленькими. - Маленькими это сваливать оттуда, когда тебя напруга врасплох застала, а приближаться надо широкими, чтобы раньше разницу потенциалов почуять, пока слабая. Если яйца задрожали и нос зачесался, ну, или наоборот, значит там тебе не рады, вот тогда вали мелкими и не отсвечивай.
Анатолий
напряжённость поля измерить
☕️ Паша ☭👨🏻‍🔧
В теории есть наверное...
☕️ Паша ☭👨🏻‍🔧
я случайно оказался прав. только в теории и есть. есть патенты - но нет готовых (серийных) устройств. только прототипы.