|
Страници по тази тема: 1 | 2 | >> (покажи всички)
Тема
|
RAID вероятности
|
|
Автор |
Milenn (турист) |
Публикувано | 16.06.12 05:02 |
|
днес ни се случи lifetime event - гръмна един твърд диск, и докато течеше реконструкцията, гръмна втори в същата РАИД група. добре че е РАИД6, иначе щяха да летят глави. Та каква е вероятността за това събитие, правилно ли смятам ?
дадено:
МТБФ=1200000 часа , 2000 диска, 17 диска в РАИД група, 30часа време за реконструкция на 1 диск, 60 за реконструция на 2 диска.
1. вероятността да загубим един кой да е диск за 1 година 1/1200000 *24 *365 * 2000
2. вероятността да загубим един точно определен диск за 30 часов период 1/1200000 *30
3. Вероятността да загубим един от останалите 16 в същата група е 1/1200000 *30 *16
4. вероятността за загубим 2 диска от една и съща група в рамките на 30 часа , което би довело до загуба на данни при РАИД5 е #1 * #3
5. вероятността да загубим 3ти диск в рамките на 60 часа от останалите 15 в същата РАИД група е 1/1200000 *60 *15
6. Вероятността да загубим данните с РАИД6 е #4 * #5
Редактирано от Milenn на 16.06.12 05:12.
| |
Тема
|
Re: RAID вероятности
[re: Milenn]
|
|
Автор |
741 (ветеринар) |
Публикувано | 19.06.12 09:44 |
|
Линейната апроксимация на вероятността работи добре само за малки числа, иначе се получава голяма грешка или безсмислица. В случая, #1 дава 14.6, което за вероятност е множко ;)
Отделно, че самият подход ми изглежда грешен. Според мен, в т.1 трябва да сложиш вероятността да се скапе произволен диск в една група в рамките на година, т.е. 1/1200000 *24 *365 *17. Тогава в т.6 ще получиш вероятността да изгубиш данни в една група. След това продължаваш:
7. Вероятността конкретна група да запази данните в продължение на една година е 1 - #6;
8. Вероятността всички групи да запазят данните в продължение на една година е #7 ^ брой групи;
9. Вероятността да се изгубят данни някъде в целия масив в продължение на една година е 1 - #8;
Отделно, че горното важи за независими събития, а в РАИД масива има корелация при отказите, та нещата на практика ще са по-зле от изчисленото по този начин.
| |
Тема
|
Re: RAID вероятности
[re: Milenn]
|
|
Автор |
zaphod (мракобес) |
Публикувано | 22.06.12 07:19 |
|
мисля че го усложняваш, погледни на първия гърмеж все едно е само "старт". от там нататък, реконструкцията трае колко, час? за час каква вероятност има да гръмне кой да е от 16 диска, грубо (само за малки вероятности) 16/1200000=1е-5 това е вероятността даден ремонт да се превърне в двоен. имайки 2000 диска, вас ви се налага да сменяте по един на всеки 600 часа, грубо месец. ако бачкаш 40 години това са 480 месеца, вероятността да наблюдаваш това чудо за един живот е 0.006, което наистина е малко, но има още много чудеса за наблюдаване, все някое се случва
NE SUTOR ULTRA CREPIDAM
| |
Тема
|
Re: RAID вероятности
[re: zaphod]
|
|
Автор |
741 (ветеринар) |
Публикувано | 22.06.12 08:24 |
|
Самата смяна може да е час, след това обаче започва преизчисляване на CRC-тата на цялата група, което отнема време и ако преди да приключи, гръмне трети диск, губят данни. Предполагам заради това е писал 30 часа. Сега обаче виждам, че за третия диск в сметките е писал 60 часа, според мен и за него трябва да се смята с 30 часа.
А чудото хич не е толкова невероятно. По време на преизчисляването дисковете работят нонстоп на максимално натоварване и ако има още някой на ръба, тогава му е точното време да умре.
| |
Тема
|
Re: RAID вероятности
[re: zaphod]
|
|
Автор |
нaив (тя) |
Публикувано | 22.06.12 15:32 |
|
"вероятността да наблюдаваш това чудо за един живот е 0.006, което наистина е малко, но има още много чудеса за наблюдаване, все някое се случва"
С каква вероятност се случва чудо с вероятност 0.006? Т.е. колко често мога да очаквам случването на чудеса - всеки ден, всяка седмица или на три години веднъж?
| |
Тема
|
Re: RAID вероятности
[re: 741]
|
|
Автор |
Milenn (турист) |
Публикувано | 25.06.12 03:35 |
|
за третия диск времето за ребилдване на 2 диска едновременно е по-голямо, щото се преви двойна работа. е времето не е двойно по-голямо, реалните резултати показаха 23 часа за ребилдване на един диск, и 35 за двойното ребилдване . предполагам, щото се случи в петък, когато другото натоварване беше почти 0. иначе, като гръмне един диск през седмицата, отиват 29-30 часа за 2ТБ диск, или 6-8 часа за 450ГБ . та от това може да се апроксимира, че двойно ребилдване през седмицата ще е около 45. освен това, като гледам сега логовете, когато е гръмнал втория диск, ребилдването на първия за известно време , около час е било на пауза. А иначе за зависимостта сигурно я има , но не е точно заради натоварването - всъщност всяка нощ се стартира "скръб" процесс, който преизчислява и сравнява чек сумите , та което ще гърми, и тогава ще гръмне.
иначе, понеже числата са малки , резултатите са почти еднакви, моите излязоха малко по оптимистични :) ама пък за умножавам по коевициента ма Мърфи отделно
| |
Тема
|
Re: RAID вероятности
[re: zaphod]
|
|
Автор |
Milenn (турист) |
Публикувано | 25.06.12 05:56 |
|
губи ми се нещо логиката .. то тя винаги ме обърква с вероятностите ..
та казваш, примаме че първия диск е гримнал ? т.е вероятност=1 ? ама все пак , да ти гръмне кой да е диск е 1/1200000 *24*365 , не схваштам как става да се игнорира
| |
Тема
|
Re: RAID вероятности
[re: Milenn]
|
|
Автор |
zaphod (мракобес) |
Публикувано | 26.06.12 07:16 |
|
да, точно така правя в началото. но после си влиза в сметките вероятността и за първия диск, когато преминавам от вероятност даден гърмеж да е двоен към плътност на събитието, събития/време. плътността на двойните изгаряния е плътността на единичните по апостериорната вероятност за двойно изгаряне.
NE SUTOR ULTRA CREPIDAM
| |
Тема
|
Re: RAID вероятности
[re: zaphod]
|
|
Автор |
Milenn (турист) |
Публикувано | 27.06.12 05:02 |
|
и колко е вероятността да изгори 3ти диск от същата група по време на двойно реконструиране ?
| |
Тема
|
Re: RAID вероятности
[re: Milenn]
|
|
Автор |
zaphod (мракобес) |
Публикувано | 29.06.12 12:34 |
|
е, това вече мирише на корелирано изгаряне
NE SUTOR ULTRA CREPIDAM
| |
|
всъщност, изглежда е доста по сложно, въпреки, че сметките излизат, понеже числата са много малки, цялата тази смекта е фундаментално грешна. Не че е важно за практиката, просто от любопитство се зарових в темата и излизат много интересни неща ( не от математическа, а от практическа гледна точка)
най-вече , че МТФБ не е вероятност, а честота на откази ( т.е. 14 от 2000 на година си е напълно правилно, просто не е вроятност). Означава че за една година най-вероятно ( колко?) ще умрат 14 диска. ако имаме голям брой групи от по 2000 диска, ( както вероятно правят теста във фабриката) в някои ще гръмнат 14, деуги 12 други 16, и ще се оформи някакво разпределение ( какво? и как се смята ?) с макс в 14
вероятността 1 диск да умре за една година е 1- ехр(-24*365/МТФБ) (от къде идва това?) , което на практика си е същото като 24*365/МТФБ ( Годишна честота на отказите ). Обаче за по-големи системи няма да е. Сега , как да се сметне МТФБ за РАид група и много РАИД групи? правилно, не приблизително .
Май го учихме това на времето , ама кой да помни :)
а иначе Гугъл публикували някъкви статистики, зависимости от температура ( изненадваща корелацив - по ниска вероятност е при относително високи температури - 40-45Ц ) , възраст ( ваноподобва крива - висок рейт първите 3 месеца, и послед след 3-тата година ), натоварване ( слаба корелация), и най-вече че МТФБ то дето го дават производителите на практика е 2-3 пъти по-ниско
между другото , сега изнамерих една грешка в дата колектора ни, та всъщност числата са по-лоши отколото си мислех - от единия репорт дето го имам пълен, от 2250 диска, губим около 5 на месец по данните от последната година , не ми се рови в архива за миналата година.
то си го пишело във уикито :
"Although the failure rate, , is often thought of as the probability that a failure occurs in a specified interval given no failure before time , it is not actually a probability because it can exceed 1"Редактирано от Milenn на 13.07.12 23:09.
| |
Тема
|
Re: RAID вероятности
[re: Milenn]
|
|
Автор |
Milenn (турист) |
Публикувано | 03.02.13 01:50 |
|
ха, пак стана. след точно 6 месеца.
явно за практически цели трябва на 2 порядъка да се презапасиш.
то верно са много дискове, и са на 4-5 години вече, ама си звучи страошно.
до преди 3-4 години, като кажеше някой РАИД6, всеки викаше ебаси разхишението, няма нужда.
а сега масивна миграция към РАИД6.
Имаше една статия, че сега РАИД6 е това което е било РАИД5 преди 20 години, поради нарастването на обемите и скоростите, и че към 2020 РАИД6 ще е толкова ненадежден, колкото е Раид5 днес.
| |
|
Страници по тази тема: 1 | 2 | >> (покажи всички)
|
|
|