Параллельные программы. Разбор примера по использованию подпрограммы для решения системы уравнений с плотной матрицей

Документ взят из кэша поисковой машины. Адрес оригинального документа : http://num-anal.srcc.msu.su/par_prog/org/examp6.htm
Дата изменения: Mon Oct 28 17:13:56 2013
Дата индексирования: Thu Feb 27 21:02:20 2014
Кодировка: Windows-1251

Разбор примера по использованию подпрограммы для решения системы уравнений с плотной матрицей

Рассмотрим подробнее пример по использованию подпрограммы PDGESV, которая предназначена для решения линейной системы алгебраических уравнений с плотной матрицей общего вида A. Данный пример приводится в описании этой подпрограммы в разделе "Пример использования" ( PDGESV.htm ).

Пример демонстрирует решение системы уравнений A * X = B с матрицей A размера 9 * 9. Ниже показана матричная форма записи этой системы.

19 3 1 12 1 16 1 3 11	x₁		0
-19 3 1 12 1 16 1 3 11	x₂		0
-19 -3 1 12 1 16 1 3 11	x₃		1
-19 -3 -1 12 1 16 1 3 11	x₄		0
-19 -3 -1 -12 1 16 1 3 11	x₅	=	0
-19 -3 -1 -12 -1 16 1 3 11	x₆		0
-19 -3 -1 -12 -1 -16 1 3 11	x₇		0
-19 3 -1 -12 -1 -16 -1 3 11	x₈		0
-19 -3 -1 -12 -1 -16 -1 -3 11	x₉		0

Для простоты решается система с одной правой частью ( NRHS = 1), т.е. правая часть B системы - вектор (матрица из одного столбца).

Сначала мы должны задать решетку процессов и распределить по ней исходные глобальные матрицы A и B.

Предположим, что матрица A разделена на блоки размером MB * NB, где MB = NB = 2. Выбрана решетка процессов размером 2 * 3, т.е. NPROW = 2 и NPCOL = 3. Таким образом, имеет место случай распределения матрицы A, приведенный в разделе документации "Пример блочно - циклического распределения плотной матрицы по решетке процессов". После подстановки конкретных значений элементов матрицы A получаем следующую картинку распределения ее элементов по процессам. ( Вверху указаны номера столбцов решетки процессов, слева - номера строк решетки процессов.)

	0		1		2
0	19 3 -19 3	1 3 1 3	1 12 1 12	11 11	1 16 1 16
	-19 -3 -19 -3	1 3 1 3	-1 -12 -1 -12	11 11	1 16 -1 16
	-19 -3	-1 -3	-1 -12	11	-1 -16
1	-19 -3 -19 -3	1 3 1 3	1 12 -1 12	11 11	1 16 1 16
1	-19 -3 -19 3	1 3 -1 3	-1 -12 -1 -12	11 11	-1 -16 -1 -16

Из последнего рисунка видно, что процесс с координатами (0, 0) содержит локальный массив (часть матрицы A) размера (5, 4).

На следующем рисунке показано разбиение на блоки и распределение по той же решетке процессов исходного вектора правых частей B.

	0	1	2
0	b₁ b₂
	b₅ b₆
	b₉
1	b₃ b₄
	b₇ b₈

Как видим, блоки состоят из двух соседних элементов вектора B и распределяются только в столбце решетки процессов с координатой 0. Процессы в других столбцах решетки не содержат никаких частей исходного глобального вектора B.

После вызова подпрограммы PDGESV и выполнения всех необходимых вычислений процесс (0, 0) будет содержать на месте локальной части вектора B локальную часть глобального вектора решений X. Ниже изображено, на месте каких элементов локального вектора B (обозначенных как ^~b_i ) с локальными индексами, какие элементы глобального вектора X с глобальными индексами оказываются расположенными по окончании вычислений. Это расположение соответствует расположению элементов исходного глобального вектора правых частей B, показанному на предыдущем рисунке. Ниже показаны также вычисленные значения элементов вектора X.

x₁	->	^~b₁		0
x₂	->	^~b₂		-1/6
x₅	->	^~b₃	=	0
x₆	->	^~b₄		0
x₉	->	^~b₅		0

Аналогичное соответствие и полученные результаты изображены далее для процесса с координатами (1, 0).

x₃	->	^~b₁		1/2
x₄	->	^~b₂		0
x₇	->	^~b₃	=	-1/2
x₈	->	^~b₄		1/6

Таким образом глобальный выходной вектор решений X имеет следующий вид:

x₁		0
x₂		-1/6
x₃		1/2
x₄		0
x₅	=	0
x₆		0
x₇		-1/2
x₈		1/6
x₉		0

Кроме того, выполняется проверка точности полученных результатов вычислением нормализованной невязки по формуле:

                            || A * x - b ||
                     ^{______________________}   .
                     ( || x || * || A || * eps * N )

Здесь eps означает машинное эпсилон, которое вычисляется с помощью вспомогательной подпрограммы PDLAMCH.