Bishop Gregory (hgr) wrote,
Bishop Gregory
hgr

Category:

славяно-сирийская инвентаризация 13: количественная оценка предыдущей серии

основная идея предлагаемого подхода в том, что реальные правдоподобия гипотезы о неслучайном происхождении чего-либо (если она истинна) и гипотезы о случайном происхождении того же самого отличаются на много порядков, т.е. в миллионы и миллиарды раз, если не еще больше. поэтому можно сравнить эти вероятности, исходя из таких условий, при которых вероятность случайного на несколько порядков завышена, а вероятность неслучайного на несколько порядков занижена, но при этом все равно должен получиться убедительный разрыв между правдоподобиями альтернативных гипотез.


тогда вместо трудноосуществимой процедуры оценки самих управляющих параметров (r, q в формулах ниже) будет достаточно оценить их предельные значения, а точнее, заведомые максимумы, т.е. такие значения, которые заведомо больше возможных для них максимальных величин.

для гипотезы о неслучайности нужно предположить ожидаемую вероятность соответствующих ей наблюдений заведомо бОльшую, чем может быть в действительности, а для гипотезы о случайности -- также заведомо бОльшую. тогда любой результат наблюдений будет заведомо легче, чем в реальности, согласовываться со "случайной" гипотезой и заведомо труднее -- с "неслучайной".

0. рассматриваем только те варианты, которые нельзя объяснить из наличных греческих рукописей, из простых ошибок при чтении или переводе с греческого, из вариантов перевода на славянский, из ошибок при передаче славянских слов (lapsi calami).

1. оцениваем только лексические варианты. это сужает базу, но не должно снижать репрезентативность. (варианты, связанные с перестановками, пропусками и добавлениями, очень плохо поддаются интерпретации, поэтому их лучше отбросить, хотя бы и ценой сужения базы). также отбрасываем морфологические варианты, кроме тех, которые достаточно резко меняют смысл, т.е., практически, все и отбрасываем (тоже ненадежны для сравнения, т.к. подвержены случайным изменениям).

таких вариантов всегда довольно мало. показательно, что в Чудовском НЗ (по кр. мере, в пределах рассмотренного Вознесенским: Рим, 1-2 Кор, Гал и не совсем до конца Еф) их нет вообще. -- вот что бывает при хорошем и хорошо переписанном переводе с хорошего греческого.

2. оцениваем общее число лексических вариантов, подлежащих учету (n). Для массива, рассмотренного Воскресенским, n = 13 (количество лексических вариантов, не имеющих очевидного объяснения из греческого или славянского и не относящихся к категориям пропусков, добавлений и перестановок) и присутствующих хотя бы в одной рукописи. примечательно, что в Чудовском НЗ таких случаев нет вообще (это новый перевод с византийского греческого). все наши случаи -- в одной (реже) или нескольких (чаще) ркп. 1 или 2 ред., иногда еще и 4-й.

3. из них "по-сирийски" интерпретируется m. m = 9 (и еще 1 под вопросом, но будем считать, что 9, см. предыдущую серию).

4. изложим сирийскую гипотезу в следующем виде: первоначальный перевод Апостола следовал такому греческому тексту, который соответствовал сирийскому (близкому к Пешитте, но с небольшими отклонениями, также известными в сир. традиции); постепенно эти чтения из славянского вычищались, больше всего их сохранилось в первой и второй редакциях, но иногда лишь в одном из списков первой или второй редакции.

тогда "сирийские" чтения должны быть не единственным, но основным источником "патологических" чтений, т.е. разумно будет принять ожидаемую, в рамках данной гипотезы, долю "сирийских" чтений среди всех "аномальных" чтений

r = 0.9 (мб., это завышенное число, но так будет осторожней: чем больше r, тем более высокие требования мы предъявляем к апостериорному правдоподобию сирийской гипотезы).

5. альтернативная "сирийской" гипотеза состоит в том, что совпадения особых чтений с сирийскими случайно. из общих соображений можно сказать, что ожидаемая в рамках этой гипотезы вероятность именно сирийских чтений будет мала. оценим ее (видимо, существенно завышая) в q = 0.01 (1 случай из 100).

(реальная вероятность совпадения аномального чтения с определенной версией без наличия между этими версиями близкой связи совсем ничтожно мала: например, в слав. Четвероевангелии нашли только одно негреческое (т.е. невизантийское) чтение Вульгаты, но даже оно совпало с сирийским.

6. сравнение (отношение) правдоподобия двух гипотез рассчитывается по формуле, основанной на теореме Байеса (это стандартная задача индуктивной логики, которая здесь применяется напрямую, без каких-бы то ни было дополнительных ухищрений):

q^m * (1-q)^(n-m) / (r^m * (1-r)^(n-m))

7. тогда вероятности двух гипотез соотносятся как

Антисирийская к Сирийской = 0.01^9 * 0.99^4 / (0.9^9 * 0.1^4) = 2.4*10^-14

разрыв такой, что говорить не о чем. и ведь мы брали заведомо завышенное значение q. если его уменьшить в два раза, все равно оставляя сильно завышенным, то, при q = 0.005,

0.005^9 * 0.995^4 / (0.9^9 * 0.1^4) = 4.9 * 10^-17

но если завысить q до 1 к 50 (q = 0.02), то получим 1.2*10^-11.

8. теперь предположим, что я сильно ошибся, и реального число "аномальных" чтений существенно выше -- n = 20. Тогда получаем

2.3 * 10^-7

но мы в области таких чисел, где сдвиг на несколько порядков ничего не меняет. таким образом, важнее то, что число 9 для таких разночтений -- оно реально большое, и очень многое перевешивает.

но предположим, что два первые разночтения тоже какие-то некошерные (к ним могут быть некие вопросы), и примем m = 7.

тогда, при n = 13, q = 0.01, r = 0.9, имеем

2.0 * 10^-8

Все эти оценки показывают, что случайное возникновение "сирийских" разночтений в Апостоле невероятно.

9. чтобы совсем уже снять сомнения, проведем расчеты при следующем неправдоподобно большом занчении

q = 0.1

(т.е. каждое десятое лексическое разночтение, соответствующее нашим параметрам, совпадает почему-то именно с сирийским).

тогда при наших n = 13, m = 9, r = 0.9 получим

1.7 * 10^-5

-- сирийская гипотеза становится в 1000 раз менее правдоподобной, но разрыв остается таким большим, что это ни на что не влияет (вот что значит иметь в запасе много нулей в десятичных знаках!).

и -- при тех же параметрах, но m = 7

мы наконец то получаем отношение 1/9 ровно (т.е. 0.1111....), т.е. тогда сирийская гипотеза начинает выигрывать только на один порядок, что маловато (такое соотношение апостериорных вероятностей легко может быть компенсировано отношением априорных вероятностей). -- но для получения первого сопоставимого соотношения для правдоподобий обеих гипотез нам пришлось сделать совершенно невозможное предположение о том, что каждое десятое лексическое отличие должно случайно совпадать со специфическими сирийскими чтениями.

P.S. для текстологов психологически непривычно, как это единичные чтения могут менять статистику, т.к. привычная для них статистика -- нормальное (Гауссово) распределение, а здесь, в расчетах, основанных на теореме Байеса, совсем другое: степенное распределение, в котором каждое наблюдение (измерение) добавляет единицу в показатель степени. поэтому малое изменение в результатах дает очень резкое различие в вероятностях (правдоподобиях).

апостериорное правдоподобие гипотезы (т.е. влияние результата измерения или наблюдения на правдоподобие гипотезы) определяется степенным, а не нормальным распределением, поэтому единичные чтения тут становятся вдруг важны, т.к. каждое из них становится единицей в показателе степени.
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments