@hadoopusers

Страница 132 из 182
Grigory
14.08.2018
12:32:39
если все есть

Eduard
14.08.2018
12:32:43
+

Grigory
14.08.2018
12:32:44
манифесты для динамик класслоада убил

Google
Alexey
14.08.2018
12:33:33
значть бы что он пытается подгрузить и как

Grigory
14.08.2018
12:33:51
ну покажи ошибку

Alexey
14.08.2018
12:34:19
щас нет под рукой

Grigory
14.08.2018
12:34:45
classy

Alexey
14.08.2018
12:35:04
дык, потыкался, забил и обошёл в итоге

но кривовато вышло. хотелось бы попроще

Eduard
14.08.2018
12:36:13
у меня просто 2 мавен профиля, 1 для локалки 2 для EMR, отличается только scope

Alexey
14.08.2018
12:36:21
лучше так вопрос сформулировать: где посмотреть что в емровском спарке отличается от ваниллы?

в плане сборки и зависимостей?

Eduard
14.08.2018
12:37:37
зайти в core и распотрошить jar)

Grigory
14.08.2018
12:37:43
ничего там не отличается в крадце

кор тотже

Google
Grigory
14.08.2018
12:38:24
ты лучше ошибку покажи и увидим в чем дело

Alexey
14.08.2018
12:38:33
ну там как минимум s3 провайдер какой-то свой и spark.sql тоже немного отличный от

Grigory
14.08.2018
12:38:49
это все класспаса дело

ты себе на локал такое ж намутить можешь просто положитв в класспас теже джарники

да вот джаиников там и правда каша не очень приятная

Alexey
14.08.2018
12:41:29
да уж. глянул щас — страшно стало

а со spark.sql вообще выкидывало jni error, даже не клас нот фаунд. но блин тоже щас логов не найду. оно юзает нативные либы?

Grigory
14.08.2018
12:50:29
надо конкретную ошибку смотреть

джава сама пользуется ими

можно жнай ошибку словить просто на разных версиях джавы

Renarde
14.08.2018
14:57:56
всем привет, подскажите пожалуйста как погасить слишком детальный вывод лога от spark2-submit в консоли? делаю так: spark2-submit data_preprocess.py --driver-java-properties "-Dlog4j.configuration=file:///path/to/log4jcustom.properties"В log4jcustom.properties вроде все уровни переставил на ERROR, но в логе продолжает сыпаться INFO

Boris
14.08.2018
15:05:21
@renardeinside а через log4j?

Инициализируешь объект Logger и дальше внутри него по цепочке выставляешь методы

Renarde
14.08.2018
15:06:37
@renardeinside а через log4j?
изнутри питоновского приложения? это так работает через spark.sparkContext.setLogLevel, но там и до непосредственного старта вываливается просто огромное INFO и прочее

Grigory
14.08.2018
15:08:13
ну еще можно попробовать --conf spark.driver.extraJavaOptions="-Dlog4j.configuration=file://${PWD}/conf/log4j.properties"

Boris
14.08.2018
15:08:43
А почему нет?) тут приведены примеры https://stackoverflow.com/questions/25193488/how-to-turn-off-info-logging-in-spark

@renardeinside

Renarde
14.08.2018
15:10:36
А почему нет?) тут приведены примеры https://stackoverflow.com/questions/25193488/how-to-turn-off-info-logging-in-spark
это пробовал - он гасит логи после создания sparkContext объекта, но до там все равно вываливается куча мусора

в итоге дело решилось установкой SPARK_CONF_DIR в кастомную локацию и прописыванием туда log4j.properties в желаемом виде. интересно что все описанные варианты есть в доке: https://spark.apache.org/docs/latest/running-on-yarn.html в разделе Debugging Your Application, но сработал из них только первый

Andrey
14.08.2018
21:04:55
Recently, Intel bought Altera, one of the largest producers of FPGAs. Intel paid a whopping $16.7 billion, making it their largest acquisition ever. In other news, Microsoft is using FPGAs in its data centers, and Amazon is offering them on their cloud services. Previously, these FPGAs were mainly used in electronics engineering, but not so much in software engineering. Are FPGAs about to take off and become serious alternatives to CPUs and GPUs? https://blog.esciencecenter.nl/why-use-an-fpga-instead-of-a-cpu-or-gpu-b234cd4f309c

Google
kutepovfedor
15.08.2018
07:42:41
Привет Ребят могу обратиться за консультацией по Cassandra?

Grigory
15.08.2018
07:44:13
да, тут использовал кто-то активно

kutepovfedor
15.08.2018
07:47:35
Мне бы проблемку решить, всё перепробовал - поднимаю руки Касандра периодически игнорирует запросы на запись когда она под нагрузкой. Причём ошибку не отдаёт. Пишу с php через драйвер DataStax

Grigory
15.08.2018
07:48:16
ааа ты уже спрашивал вроде тут

kutepovfedor
15.08.2018
07:50:05
Только она не отказывается, а говорит типа "всё гуд, давай след запрос, чувак" )))

А запись не появляется

даже через cqlsh

Dan
15.08.2018
07:52:12
А запись не появляется
ну тут имхо вариантов два - или она кэширует и будет классический eventually consistent, или это баг

kutepovfedor
15.08.2018
07:52:43
ну тут имхо вариантов два - или она кэширует и будет классический eventually consistent, или это баг
Если кеширует, то после репейра должна внести запись в БД, верно?

kutepovfedor
15.08.2018
07:56:48
"eventually" :)
не понял))))

Grigory
15.08.2018
07:57:21
не понял))))
когданить будет консистентой

в конечном счете

kutepovfedor
15.08.2018
07:57:46
Мне клиентам так же ответить? XD

Dan
15.08.2018
07:58:29
не понял))))
ну по идее "когда нибудь" оно таки приземлится на диски. Или нет :) кассандра - офигенна по концепции но хреновата по имплементации. Но меня не надо слушать, я не без собственной адженды в этом плане

Alexey
15.08.2018
07:59:04
"имплементировать экспоненциальный бэк-офф" (с)

Grigory
15.08.2018
08:02:45
Мне клиентам так же ответить? XD
а как ты проверяешь ответ?

Google
Grigory
15.08.2018
08:02:50
что вставилось

kutepovfedor
15.08.2018
08:03:19
а как ты проверяешь ответ?
Пишу синхронно Если ошибок нет - значит вставилось

Dan
15.08.2018
08:04:06
какой CL?

kutepovfedor
15.08.2018
08:04:18
LQ

Менял кстати, - ваще пофигу

All делал))

Dan
15.08.2018
08:05:28
All делал))
все больше на баг смахивает

kutepovfedor
15.08.2018
08:05:59
Я уже начал грешить на свои гривые руки

Dan
15.08.2018
08:06:44
можно забуриться в слак или IRC датастакс, поспрашивать. Наши на такое обычно достаточно оперативно отвечают

kutepovfedor
15.08.2018
08:31:22
о какой нагрузке идет речь? И распиши плз конфиг кассандры, интересно)
3 потока на чтение/запись в перемешку каждый пишет пачками по 1000 за 4сек, нонстоп Пример таблички: CREATE TABLE company.egrul_card ( id text PRIMARY KEY, data text ) WITH bloom_filter_fp_chance = 0.01 AND caching = {'keys': 'NONE', 'rows_per_partition': 'NONE'} AND comment = '' AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'} AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'} AND crc_check_chance = 1.0 AND dclocal_read_repair_chance = 0.1 AND default_time_to_live = 0 AND gc_grace_seconds = 864000 AND max_index_interval = 2048 AND memtable_flush_period_in_ms = 0 AND min_index_interval = 128 AND read_repair_chance = 0.0 AND speculative_retry = '99PERCENTILE';

Andrey
15.08.2018
08:32:28
а сам кластер?

физика/виртуалки? ssd/hdd ?

скок нод и т п

и еще describe keyspace

и какая версия кассандры

kutepovfedor
15.08.2018
08:34:47
а сам кластер?
3 тачки, толстые в них proxmox на каждой тачке виртуалка для касандры 500гб, 34гб памяти, 64CPU cqlsh> DESCRIBE company; CREATE KEYSPACE company WITH replication = {'class': 'SimpleStrategy', 'replication_factor': '2'} AND durable_writes = true;

Andrey
15.08.2018
08:35:34
диски хдд или ссд?

kutepovfedor
15.08.2018
08:35:47
xdd

Andrey
15.08.2018
08:36:47
вот это сразу в глаза бросается 'replication_factor': '2' Это было осознанное решение?

Google
kutepovfedor
15.08.2018
08:37:01
Ну да, по 66% хранить

Не 3 же делать

Andrey
15.08.2018
08:40:01
я бы на момент диагностики 3 включил

мало ли что, обычно не рекомендуют ниже 3 ставить

kutepovfedor
15.08.2018
08:41:44
мало ли что, обычно не рекомендуют ниже 3 ставить
Это когда речь идёт о кластере в 20+ нод наверное

Andrey
15.08.2018
08:42:08
с моей точки зрения все равно, это условие нормального существования распределенной системы

kutepovfedor
15.08.2018
08:42:41
Я могу попробовать, но что-то подсказывает что проблема не уйдёт =(

Andrey
15.08.2018
08:42:51
попробуй, я тоже думаю что не уйдет

Grigory
15.08.2018
08:43:01
мне кажется число 2 прост не любят у нас изза кворума зукипера (например; проблема не ток его))

kutepovfedor
15.08.2018
08:43:24
А есть какие-то лимиты на одну ноду? По диску, по памяти? Может по кол-ву документов?

Andrey
15.08.2018
08:43:32
но такие вещи проще сразу проверить) до того, как начнешь дампы sstables читать

kutepovfedor
15.08.2018
08:43:36
Может у меня ноды перегружены

Grigory
15.08.2018
08:43:52
думаю это из-за любого кворума
ну конечно, я поправил там)

Dan
15.08.2018
08:44:06
Может у меня ноды перегружены
кстати, проксмокс, это же kvm, у тебя сами машины как настроены?

Andrey
15.08.2018
08:44:08
вот дальше смотри - после того как проверишь на рф3, смотри статы дисков

Страница 132 из 182