Откуда взялись операции на матрицами

Автор темы cutter 
ОбъявленияПоследний пост
ОбъявлениеОткрыта свободная публикация вакансий для математиков26.09.2019 16:34
ОбъявлениеИщем преподавателя для углубленного обучения статистическим методам29.05.2020 13:22
ОбъявлениеГранты для студентов и аспирантов мехмата и физфака МГУ на обучение в магистратуре Кембриджа20.10.2020 18:59
03.11.2003 14:25
cutter
Откуда взялись операции на матрицами
Всем привет!

10 лет назад изучал высшую математику и только сейчас возникла необходимость работы с матрицами, но... С позиции прожитых лет - возник следующий вопрос: "На основании чего сформулированы операции сложения и умножения матриц???" Если есть где почитать, дайте пожалуйста ссылку - ну не могу я просто так брать и умножать матрицы, не понимая - на основании чего... :(
03.11.2003 17:32
Александр
Все просто

Матрица - это просто запись линейного отображения в некоторм базисе. Умножение матриц - это композиция операторов.

В одномерном пространстве линейный оператор - это умножение на число. А композиция соответствует обычному умножению.

На пространстве линейных операторов можно ввести структуру сложения: (A+B)(x) = A(x)+B(x). Это - просто формальное определение суммы 2-х операторов. А теперь попробуем записать A+B, A, B в матричном виде относительно одного фиксированного базиса. Получим правило сложения.

Все просто :).
04.11.2003 12:19
egor
более подробно
Александр ответил идеально точно, чётко и строго.
Но cutter мог уже подзабыть, что такое линейные операторы.
Строгое изложение см., например, в учебнике
А.И. Кострикин "Линейная алгебра", первые 2 главы,
(а также в учебниках Куроша, Гельфанда и др.)
Я попробую пояснить "на пальцах".

Определение. Пусть L_1,L_2 - линейные пространства.
Отображение f:L_1->L_2 называется линейным отображением
(или линейным оператором), если
f(alpha x + beta y)=alpha f(x)+beta f(y)
для любых alpha,beta \in L_1.

Легко доказать, что любой линейный оператор f: R^n -> R^m
обязан действовать по формуле вида
(f(x))_i = \sum_{j=1}^n a_{ij} x_j (i=1,...,m),
где a_{ij} - некоторые коэффициенты.
Здесь x_j обозначает j-ю координату j, (f(x))_i - i-ю координату f(x).

Эти коэффициенты a_{ij} записывают в виде матрицы A размера m на n.
Умножение матрицы A на вектор x определяют так, чтобы f(x)=A x, т.е.
(Ax)_i=\sum_{j=1}^n a_{ij} x_j.
Можно отождествлять линейный оператор с матрицей.
(Если действие происходит в абстрактном линейном пространстве,
то для этого нужно, конечно, зафиксировать какой-нибудь базис.)

Пусть теперь имеются две матрицы:
A размера m на p (m строк, p столбцов), B размера p на n.
Сначала подействуем матрицей B на вектор x \in R^n, т.е. умножим B на x:
(Bx)_k=\sum_{j=1}^n b_{kj} x_k.
Затем подействуем матрицей A на вектор y=Bx:

(A(Bx))_i(Ay)_i = \sum_{k=1}^p a_{ik} y_k = (подставляем y=Bx)
= \sum_{k=1}^p a_{ik} \sum_{j=1}^n b_{kj} x_j =
(меняем порядок суммирования)
= \sum_{j=1}^n (\sum_{k=1}^p a_{ik} b_{kj}) x_j.

Выражение в скобках, зависящее от i и j (i=1,...,m; j=1,...,n),
обозначим через c_{ij}.
Тогда
(A(Bx))_i = \sum_{j=1}^n c_{ij} x_j,
т.е. A(Bx)=Cx, где C - матрица с элементами c_{ij}.
При этом элементы матрицы C вычисляются по правилу
c_{ij}=\sum_{k=1}^p a_{ik} b_{kj}. (*)

Итак, если мы действуем на вектор x сначала матрицей B,
а затем матрицей A, то это всё равно что подействовать матрицей C,
причём элементы C нужно считать по формуле (*).
Естественно матрицу C называть произведением матриц A и B,
чтобы можно было вместо A(Bx) писать (AB)x.

Другими словами, если операция умножения матрицы на вектор
определена заранее, то операцию умножения матриц определяют так, чтобы (AB)x=A(Bx).
Извините, только зарегистрированные пользователи могут публиковать сообщения в этом форуме.

Кликните здесь, чтобы войти