
KrivdaAllStars
25.10.2018
12:37:48

Grigory
25.10.2018
12:37:55
а зачем такие большие тачки тогда
у тя будут ресурсы и все в простое

KrivdaAllStars
25.10.2018
12:38:02
вы упираетесь в цпу юниты

Google

Grigory
25.10.2018
12:38:09
зачем те оператива и диски если спу нет

Старый
25.10.2018
12:38:12

KrivdaAllStars
25.10.2018
12:38:38
по той же цене
да глянь книжку
на нее ссылаться можно

Старый
25.10.2018
12:39:29

KrivdaAllStars
25.10.2018
12:39:41

Старый
25.10.2018
12:39:47
мне заявили галвное обеспечить чтобы работало и хранило, а скорость вопрос тертий

KrivdaAllStars
25.10.2018
12:40:03
оно когда отвалится
потому что у вас кластер из двух нод
но БОГАТЫРСКИХ

Старый
25.10.2018
12:40:28

Google

KrivdaAllStars
25.10.2018
12:40:32
да я образно
книжку для себя прочитать можно

Anton
25.10.2018
12:41:35
зачем вообще хадуп если кластер из двух нод? просто файл сервер, а если данные структурированные изначально - базу данных
спарк можно гонять против нфс шары или даже локальной файловой системы

KrivdaAllStars
25.10.2018
12:42:11

Старый
25.10.2018
12:42:16
я еле отговорил от этого

KrivdaAllStars
25.10.2018
12:42:52
ну прост чуваки, может вам рил купить лицензии на по которое решает вашу пробелму на малом количестве нод, оно и хранит и считает

Старый
25.10.2018
12:43:53

Anton
25.10.2018
12:44:15
linux + rsync

Grigory
25.10.2018
12:44:23
да рил короч есть сетапы
жирные тачки всегда дороже

Anton
25.10.2018
12:44:45
жирные тачки всегда лучше
есть узкий набор кейсов когда удобнее иметь худые тачки, но в общем жирные лучше

Старый
25.10.2018
12:45:21
да и на процах не сэкономишь

KrivdaAllStars
25.10.2018
12:46:20

Grigory
25.10.2018
12:46:49
проц время дорогое в жирных тачилах прсот

KrivdaAllStars
25.10.2018
12:46:53
у тебя все равно должно быть определенное количество цпу юнитов на гиг

Anton
25.10.2018
12:47:12

Google

Grigory
25.10.2018
12:47:14
спарки взлетать не будут
существовать

Anton
25.10.2018
12:47:34
но кому он такой нужен? :)

Grigory
25.10.2018
12:47:41
ну хдфс если то вполне

KrivdaAllStars
25.10.2018
12:47:52
хдфс так задизайнен

Anton
25.10.2018
12:47:59
про какой объем данных мы говорим?

KrivdaAllStars
25.10.2018
12:48:01
ему не нужны дорогие процы и дорогие диски

Grigory
25.10.2018
12:48:05
да хоть тбы
много тбов

Anton
25.10.2018
12:48:20
просто ФС будет намного лучше

Grigory
25.10.2018
12:48:23
медленные диски быстрая сеть нужна и тачки рядом

Anton
25.10.2018
12:48:31
ext4, xfs

Grigory
25.10.2018
12:48:32
на самом деле согласен

KrivdaAllStars
25.10.2018
12:48:44

Grigory
25.10.2018
12:48:47
эта ваша бигдата
просто рибята
ext4
и все рсинком

Google

Grigory
25.10.2018
12:49:01
вместо спарка много апликух на голанге
профит

Anton
25.10.2018
12:49:06
одна жирная тачка файл сервер, реплика на другую, компьют на бездисковых тачках спарком против nfs
летает просто

Grigory
25.10.2018
12:49:19
пока иопсов хватает

Anton
25.10.2018
12:49:38
да, но мы говорим же про десятки терабайт

Grigory
25.10.2018
12:49:39
актинвые рид райты кластера спарка
ну и что

Anton
25.10.2018
12:50:26
я не из головы придумал, было несколько маленьких проектов где мы просто на толстом файлере данные держали - все отлично работает

Grigory
25.10.2018
12:50:33
я тоже не из головы придумал
делал все на рсинках и голанге - лучшией сетап

Старый
25.10.2018
12:52:25
какие ужасы

Anton
25.10.2018
12:52:35
на hetzner тачки SX - самая большая дает 75 ТБ в RAID1, стоит 300 евро в месяц

Grigory
25.10.2018
12:52:56
мне кажется он не может хетснер юзать

KrivdaAllStars
25.10.2018
12:52:57

Anton
25.10.2018
12:52:58
если данных больше 30 ТБ никогда не будет - отличный вариант, все летает просто

Grigory
25.10.2018
12:54:38

KrivdaAllStars
25.10.2018
12:54:50

Grigory
25.10.2018
12:54:54

Google

Anton
25.10.2018
12:55:11

Grigory
25.10.2018
12:55:28
главное не упираться в боттленк на чтении
и записи

Anton
25.10.2018
12:56:07

Andrey
25.10.2018
12:57:03

Старый
25.10.2018
12:57:09
которая в спарке

Anton
25.10.2018
12:57:31
у меня есть клиент с EMC Isilon под сторадж, он умеет S3, HDFS и кучу апишек показывать, сеть там инфинибенд от меланокса, посадили на это кучу компьют нод - промышленное решение, даже Ranger прикрутили

KrivdaAllStars
25.10.2018
12:58:05

Anton
25.10.2018
12:58:17
(она не нужна)

KrivdaAllStars
25.10.2018
12:59:09

Anton
25.10.2018
12:59:20
у тебя сеть на узле шире чем диск, только low latency операции будут тормозить, а потоковое чтение не будет

KrivdaAllStars
25.10.2018
12:59:29
вы говорите о вендор лок решениях, которые могут работать быстрее

Anton
25.10.2018
12:59:38
нет
ну isilon это вендор лок

KrivdaAllStars
25.10.2018
12:59:52
ну как нет