Строение трансформатора: Трансформатор. Устройство и принцип действия трансформатора.

Содержание

Трансформатор. Устройство и принцип действия трансформатора.

Простейший трансформатор представляет собой устройство, состоящее из стального сердечника и двух обмоток (рис. 1). При подаче в первичную обмотку переменного напряжения, во вторичной обмотке индуцируется ЭДС той же частоты. Если ко вторичной обмотке подключить некоторый электроприемник, то в ней возникает электрический ток и на вторичных зажимах трансформатора устанавливается напряжение, которое несколько меньше, чем ЭДС и в некоторой относительно малой степени зависит от нагрузки. Отношение первичного напряжения ко вторичному (коэффициент трансформации) приблизительно равно отношению чисел витков первичной и вторичной обмоток.

Рис. 1. Принцип устройства однофазного двухобмоточного трансформатора. 1 первичная обмотка, 2 вторичная обмотка, 3 сердечник. U1 первичное напряжение, U2 вторичное напряжение, I1 первичный ток, I2 вторичный ток, Ф магнитный поток

Простейшие условные обозначения трансформаторов изображены на рис. 2; для наглядности разные обмотки трансформатора можно, как и на рисунке, представить разными цветами.

Рис. 2. Условное обозначение трансформатора в подробных (многолинейных) схемах (a) и в схемах электрических сетей (b)

Трансформаторы могут быть одно- или многофазными, а вторичных обмоток может быть больше одной. В электрических сетях обычно используются трехфазные трансформаторы с одной или двумя вторичными обмотками. Если первичное и вторичное напряжения относительно близки друг другу, то могут использоваться и однообмоточные автотрансформаторы, принципиальные схемы которых представлены на рис. 3.

Рис. 3. Принципиальные схемы понижающего (a) и повышающего (b) автотрансформаторов

Важнейшими номинальными показателями трансформатора являются его номинальные первичное и вторичное напряжения, номинальные первичный и вторичный ток, а также номинальная вторичная полная мощность (номинальная мощность). Трансформаторы могут изготовляться как на весьма малую мощность (например, для микроэлектронных цепей), так и на очень большую (например, для мощных энергосистем), охватывая диапазон мощностей от 0,1 mVA до 1000 MVA.

Потери энергии в трансформаторе – обусловленные активным сопротивлением обмоток потери в меди и вызванные вихревыми токами и гистерезисом в сердечнике потери в стали – обычно настолько малы, что кпд трансформатора, как правило, выше 99 %. Несмотря на это, тепловыделение в мощных трансформаторах может оказаться настолько сильным, что необходимо прибегать к эффективным способам теплоотвода. Чаще всего активная часть трансформатора размещается в баке, заполненном минеральным (трасформаторным) маслом, который, при необходимости снабжается принудительным воздушным или водяным охлаждением. При мощности до 10 MVA (иногда и выше) могут применяться и сухие трансформаторы, обмотки которых обычно залиты с эпоксидной смолой. Основные преимущества сухих трансформаторов заключаются в более высокой огнебезопасности и в исключении течи трансформаторного масла, благодаря чему они могут без препятствий устанавливаться в любых частях зданий, в том числе на любом этаже. Для измерения переменных тока или напряжения (особенно в случае больших токов и высоких напряжений) часто используются измерительные трансформаторы.

Устройство трансформатора напряжения по своему принципу не отличается от силовых трансформаторов, но работает он в режиме, близком к холостому ходу; коэффициент трансформации в таком случае достаточно постоянен. Номинальное вторичное напряжение таких трансформаторов обычно равно 100 V. Вторичная обмотка трансформатора тока в идеальном случае короткозамкнута и вторичный ток в таком случае пропорционален первичному. Номинальный вторичный ток обычно составляет 5 A, но иногда может быть и меньше (например, 1 A). Примеры условных обозначений трансформаторов тока приведены на рис. 4.

Рис. 4. Условное обозначение трансформатора тока в развернутых схемах (a) и в однолинейных схемах (b)

Первым трансформатором может считаться изготовленное Майклом Фарадеем (Michael Faraday) индукционное кольцо (англ. induction ring), состоящее из кольцевого стального сердечника и двух обмоток, при помощи которого он 29 августа 1831 года открыл явление электромагнитной индукции (рис. 5). Во время быстрого переходного процесса, возникающего при включении или отключении первичной обмотки, соединенной с источником постоянного тока, во вторичной обмотке индуцируется импульсная ЭДС. Такое устройство может поэтому называться импульсным или транзиентным трансформатором.

Рис. 5. Принцип устройства транзиентного трансформатора Майкла Фарадея. i1 первичный ток, i2 вторичный ток, t время

Исходя из открытия Фарадея, учитель физики колледжа города Маргнута (Margnooth) около Дублина (Dublin, Ирландия) Николас Келлан (Nicholas Callan, 1799–1864) построил в 1836 году индукционную катушку (искровой индуктор), состоящий из прерывателя и трансформатора; это устройство позволяло преобразовать постоянный ток в переменный ток высокого напряжения и вызывать длинные искровые разряды. Индукционные катушки стали быстро усовершенствоваться и в 19-м веке широко применялись при исследовании электрических разрядов. К ним могут быть отнесены и катушки зажигания современных автомобилей. Первый трансформатор переменного тока запатентовал в 1876 году живший в Париже русский электротехник Павел Яблочков, использовав его в цепях питания своих дуговых ламп. Сердечник трансформатора Яблочкова представлял собой прямой пучок стальных проволок, вследствие чего магнитная цепь была не замкнутой, как у Фарадея, а открытой, и в других установках такой трансформатор применять не стали. В 1885 году инженеры-электрики Будапештского завода Ганц и Компания (Ganz & Co.) Макс Дери (Max Deri, 172 1854–1938), Отто Титуш Блати (Otto Titus Blathy, 1860–1939) и Кароль Зиперновски (Karoly Zipernovsky, 1853–1942) изготовили трансформатор с тороидальным проволочным сердечником и заодно разработали систему распределения электроэнергии на переменном токе, основанную на применении этих трансформаторов. Трансформатор с еще лучшими свойствами, сердечник которого собирался из Е- и I-образных стальных листов, создал в том же году американский электротехник Уильям Стенли (William Stanley, 1858–1916), после чего началось быстрое развитие систем переменного тока как в Европе, так и в Америке. Первый трехфазный трансформатор построил в 1889 году Михаил Доливо-Добровольский.

Принцип работы и конструкция трансформатора

Трансформаторы различают:
по уровню мощности – малой мощности, с номинальной мощностью 5 кВ·А и ниже у трехфазных и 4 кВ·А и ниже у однофазных; силовые однофазные и трехфазные трансформаторы большей мощности;

  • по назначению – силовые трансформаторы систем энергоснабжения, предназначенные для преобразования электрической энергии с целью ее передачи и распределения с наилучшими технико-экономическими показателями; трансформаторы питания – трансформаторы малой мощности, предназначенные для преобразования напряжения электрических сетей в напряжение, необходимое для питания электронной аппаратуры, маломощного электрического оборудования и бытовых устройств, статических преобразователей энергии и т.д.; измерительные трансформаторы, расширяющие пределы измерения амперметров, вольтметров и ваттметров переменного тока; импульсные трансформаторы, предназначенные для формирования, передачи и преобразования импульсных сигналов;
  • по числу фаз – одно- и трехфазные; трансформаторы с числом фаз более трех встречаются только в некоторых специальных схемах;
  • по числу обмоток в фазе – двух- и многообмоточные.

Трансформаторы выполняют либо с воздушным, либо с масляным охлаждением; каждый из способов может быть либо с естественным теплообменом, либо с принудительной вентиляцией. В автоматических системах наиболее распространены однофазные и трехфазные трансформаторы питания малой мощности с воздушным охлаждением.

Конструкция однофазных трансформаторов питания.
Основные части трансформаторов – обмотки, осуществляющие электромагнитное преобразование энергии, и магнитопровод (магнитная система), выполненный из ферромагнитного материала и предназначенный для локализации магнитного потока и усиления электромагнитной связи обмоток. Магнитопровод трансформаторов малой мощности изготавливают из листовой или ленточной электротехнической стали толщиной 0,1 – 0,35 мм.


Рис. 1.1

В зависимости от конфигурации магнитопровода различают трансформаторы стержневого, броневого и кольцевого типов. Конструктивные схемы таких двухобмоточных трансформаторов с ленточным магнитопроводом представлены соответственно на рис. 1.1, а-в. Магнитопровод 1 навивают из узкой ленты на станках; при этом магнитопровод броневого типа (рис. 1.1, б) собирают из двух магнитопроводов стержневого типа. Слои ленты изолируют друг от друга тонким слоем окисла, пленкой лака или бумагой с целью уменьшения вихревых токов, наводимых в магнитопроводе переменным магнитным потоком. Навитые магнитопроводы трансформаторов стержневого и броневого типов разрезают на две половины по линии А-А для создания возможности монтажа на них заранее намотанных обмоток. После монтажа обмоток половины вновь соединяют и плотно стягивают специальными обжимами. Использование ленты, нарезанной вдоль направления наибольшей магнитной проницаемости материала, позволяет создавать магнитопроводы на всех участках которых магнитный поток идет по пути наименьшего магнитного сопротивления материала. Участки магнитопровода, на которых расположены обмотки, называют стержнями, остальные участки – ярмом. Для обеспечения постоянной магнитной индукции по всему магнитопроводу у трансформаторов броневого типа ширина центрального стержня в два раза больше, чем боковых участков ярма.

Обмотка трансформатора – это совокупность витков, образующих электрическую цепь, в которой суммируются ЭДС витков. Обмотки 3, 4 трансформаторов стержневого и броневого типов представляют собой катушки, намотанные из изолированного провода, в большинстве случаев медного, на изолирующий каркас 2 или гильзу. Отдельные слои проводов изолируют друг от друга тонкой межслойной изоляцией из специальной бумаги или ткани, пропитанной лаками; между обмотками прокладывают более толстую межобмоточную изоляцию. Обмотки трансформатора, к которым электрическая энергия подводится, называют первичными, обмотки, от которых электрическая энергия отводится, – вторичными. Если на стержне в пределах катушки первичные и вторичные обмотки располагаются концентрично одна поверх другой, их называют концентрическими (рис. 1.1, a). При этом у стержневого трансформатора в катушках расположено по половине витков каждой из обмоток. Возможно раздельное расположение первичных и вторичных обмоток на каждом из стержней, но магнитная связь обмоток в этом случае ухудшается.

Если обмотки чередуются в осевом направлении стержня в виде отдельных катушек, имеющих форму дисков, их называют чередующимися (рис. 1.1, б). В кольцевых трансформаторах (рис. 1.1, в) обмотки наматывают непосредственно на изолированный магнитопровод одна поверх другой по всей длине магнитопровода, при этом на внутренней стороне кольца слоев получается больше, чем на внешней.
Повышение электрической прочности трансформаторов и их устойчивости к механическим и атмосферным воздействиям достигается путем пропитки обмоток изоляционными лаками или компаундами или заливкой трансформаторов в эпоксидную смолу. Стержневые трансформаторы имеют наилучшие условия охлаждения ввиду большой поверхности охлаждения обмоток. Броневые трансформаторы благодаря меньшему числу катушек имеют меньшие размеры и более просты в изготовлении. Кольцевые трансформаторы отличаются малыми потоками рассеяния и низким сопротивлением сердечника благодаря отсутствию воздушных зазоров на пути потока, но более сложны в изготовлении ввиду невозможности предварительной намотки обмоток вне магнитопровода.


Рис. 1.2

Магнитопроводы трансформаторов, собранные из штампованных листов, представлены на рис. 1.2. Магнитопроводы стержневых трансформаторов собирают из листов П-образной формы (рис. 1.2, а), броневых – из Ш-образной формы (рис. 1.2, б), кольцевых – из колец (рис. 1.2, в).

Принцип действия трансформатора.

Принцип действия рассмотрим на примере однофазного двухобмоточного трансформатора (рис. 1.3), первичная обмотка которого с числом витков w1 включена в однофазную сеть переменного тока с напряжением u1, а вторичная обмотка с числом витков w2 замкнута на сопротивление нагрузки Zн. Под действием приложенного напряжения u1 по первичной обмотке протекает ток i1, создающий МДС первичной обмотки F1= i1w1, которая приводит к появлению переменного магнитного потока. Основная часть потока (поток взаимоиндукции Ф) замыкается по магнитопроводу, сцепляется с обеими обмотками и наводит в них ЭДС e1 и e2. Небольшая часть потока Ф

σ1, называемая потоком рассеяния первичной обмотки, замыкается по воздуху непосредственно вокруг этой обмотки.


Рис. 1.3

Во вторичной обмотке ЭДС e 2 вызывает ток i 2 , на сопротивлении нагрузки Z н снимается выходное напряжение u 2 =i 2 Z н и выходная мощность P 2 =u 2 i 2 Одновременно ток i 2 создает МДС вторичной обмотки F 2 =i 2 w 2 , направление которой в контуре магнитопровода определяется по правилу Ленца. Значение потока взаимоиндукции Ф 0 определяется результирующим действием МДС F 1 и F 2 . В обеих обмотках ЭДС взаимоиндукции определяются в соответствии с законом электромагнитной индукции:

e 1 =-w 1 dФ 0 /dt; e 2 =-w 2 dФ 0 /dt (1.1)

Поток Ф σ1 наводит ЭДС самоиндукции в первичной обмотке:

e σ1 =-L σ1 di 1 /dt, (1.2)
где L σ1 – индуктивность первичной обмотки, соответствующая потоку рассеяния.

При увеличении тока нагрузки i 2 МДС F 2 стремится уменьшить поток Ф 0 и тем самым – ЭДС e 1 . Поскольку трансформаторы выполняют с минимальными потоками рассеяния и минимальным активным сопротивлением обмоток, основная часть приложенного напряжения u 1 уравновешивается ЭДС e 1 , которая направлена в контуре обмотки встречно напряжению u 1 ; при неизменной амплитуде напряжения u 1 ток i 1 увеличивается. Таким образом, приращение выходной мощности покрывается за счет приращения потребляемой мощности P 1 =u 1 i 1 . Увеличение тока i 1 приводит к увеличению МДС F 1 , и поток Ф 0 восстанавливается до прежнего значения. Небольшое уменьшение потока может быть вызвано падением части приложенного напряжения на сопротивлении обмотки. Это изменение тем больше, чем меньше мощность трансформатора, однако при изменении тока нагрузки от нуля (холостой ход) до номинального значения оно не превышает нескольких процентов. Магнитодвижущая сила F 1 вызывает также появление потока рассеяния вторичной обмотки Ф σ2 , наводящего ЭДС самоиндукции во вторичной обмотке:

e σ2 = -L σ2 di 2 /dt (1.3)

При допущении о линейной зависимости индукции от напряженности магнитного поля и отсутствии гистерезиса в магнитной системе трансформатора можно утверждать, что в трансформаторе, подключенном к сети переменного синусоидального напряжения, все токи, потоки, ЭДС и напряжения изменяются по синусоидальному закону. Напряжение u 1 , приложенное к первичной обмотке, уравновешивается в основном наведенной ЭДС взаимоиндукции, т.е. u 1 ≈ -e 1 . При синусоидальном напряжении источника u 1 =U 1m sinωt выражение (1.1) можно представить в виде
dФ 0 ≈(u 1 /w 1 )dt=(U 1m /w 1 )sinωtdt (ω=2πf – угловая частота напряжения), откуда после интегрирования получим выражение для потока:

Ф 0 = ∫(u 1 /w 1 )dt=- Ф m cosωt, (1.4)
Ф m ≈ U 1m /(w 1 ω)= U 1 /(4,44fw 1 ) (1.5)

Ф m – амплитудное значение потока Ф 0 .
Из (1.5) видно, что амплитуда основного магнитного потока определяется амплитудой U 1m , угловой частотой первичного напряжения ω и числом витков w 1 первичной обмотки.
Подставив (1.4) в (1.1), после дифференцирования получим

e 1 =-E 1m sinωt; e 2 = -E 2m sinωt (1.6)
где E 1m =ωФ m w 1 ; E 2m =ωФ m w 2 – амплитудные значения ЭДС взаимоиндукции.

Из формулы (1.6) видно, что ЭДС e 1 и e 2 совпадают друг с другом по фазе и отстают от вызывающего их магнитного потока на 90°. При переходе к действующим значениям ЭДС получаем:

E 1 =4,44fФ m w 1 ; E 2 =4,44fФ m w 2 (1.7)

Соотношение напряжений на входе и выходе трансформатора определяется в основном соотношением ЭДС взаимоиндукции в первичной и вторичной обмотках, которое называется теоретическим коэффициентом трансформации:

K т =E 1 /E 2 =w 1 /w 2 (1.8)

Как видно, соотношение напряжений на обмотках трансформатора определяется соотношением чисел витков.

Ток, необходимый для создания магнитного потока и являющийся по характеру реактивным (индуктивным), называют намагничивающим током трансформатора I 0p . Он протекает по первичной обмотке независимо от того, нагружен трансформатор или нет, и является основной составляющей тока холостого хода (х.х.) трансформатора. По закону Ома для магнитной цепи:

Ф m = √2·I 0p w 1 /R м (1.9)
где R м – магнитное сопротивление магнитопровода трансформатора.

Преобразуя (1.9) с учетом (1.5), получим: I 0p =Ф m R м /(2·w 1 )=U 1 R м /(6,28f·w 1 2 )

Как видно, намагничивающий ток прямо пропорционален магнитному сопротивлению магнитопровода. Поэтому при проектировании и изготовлении магнитопроводов трансформаторов следует сводить к минимуму воздушные зазоры на пути основного магнитного потока, так как магнитная проницаемость воздуха значительно меньше магнитной проницаемости ферромагнитных материалов.
Необходимо отметить, что в реальных трансформаторах перемагничивание магнитопроводов происходит по нелинейному закону (петля намагничивания). Поэтому временной закон изменения ЭДС, токов и напряжений в зависимости от степени насыщения сердечника может более или менее отличаться от синусоидального.
Процесс передачи мощности с первичной на вторичную обмотку трансформатора сопровождается потерями части активной мощности. Мощность, называемая электрическими потерями, выделяется на активном сопротивлении обмоток при протекании по ним тока:

ΔP э =I 1 2 R 1 +I 2 2 R 2 (1.10)
где R 1 и R 2 – активные сопротивления обмоток.

Значение электрических потерь зависит от токов в обмотках, т.е. от режима нагрузки, поэтому электрические потери называют переменными потерями трансформатора.
Мощность ΔP м , называемая магнитными потерями, выделяется в магнитопроводе при прохождении по ней переменного магнитного потока. Она обусловлена наличием вихревых токов, наводимых переменным потоком, и явлением гистерезиса.
Значение ΔP м зависит от свойств материала магнитопровода, индукции в магнитопроводе и частоты его перемагничивания. Как видно из (1.5), поток, а следовательно, и индукция не зависят от нагрузки, поэтому потери ΔP м называют постоянными потерями трансформатора. Так как потери на вихревые токи и гистерезис пропорциональны примерно квадрату индукции, то ΔP м

U 1 2 . Выделение части потребляемой трансформатором мощности в виде электрических и магнитных потерь приводит к нагреву трансформатора.
Потери ΔP м выделяются в трансформаторе и в режиме х.х., поэтому при х.х., не отдавая полезной выходной мощности, трансформатор потребляет от источника некоторую активную мощность, идущую на покрытие потерь. Следовательно, в токе х.х. I 0 имеется активная составляющая I 0a , которая обычно не превышает 10% от намагничивающей составляющей тока х.х. I 0p . У трансформаторов большой и средней мощности ток I 0 = I 0a +j I 0p не превышает 2-10% от номинального; у трансформаторов микромощности его значение может достигать 40-60% от номинального.
Следует отметить, что наряду с трансформаторами, имеющими фиксированный коэффициент трансформации, выпускается ряд типов трансформаторов с регулируемым вторичным напряжением. В основном регулирование осуществляется изменением соотношения между числами витков первичной и вторичной обмоток. При ступенчатом регулировании обмотка, обычно вторичная, имеет ряд ответвлений с различным числом витков. Выводы ответвлений подведены к переключателю. Для плавного регулирования трансформатор может быть выполнен со скользящим контактом – щетками, перемещающимися по неизолированной контактной дорожке на поверхности проводников вторичной обмотки и подключающими к выходу различное число витков.

Трехфазные трансформаторы.
Трехфазные трансформаторы мощностью в единицы и десятки кВ·А обычно выполняют с единой магнитной системой фаз; в этом случае конструкция магнитной системы напоминает конструкцию магнитной системы однофазного броневого трансформатора (см. рис. 1.1, б) с той лишь разницей, что здесь поперечное сечение всех трех стержней одинаковое (рис. 1.4, а). Большими буквами A, B, C обозначаются выводы обмотки высокого напряжения, малыми a, b, c – выводы низкого напряжения. Основные схемы соединения обмоток фаз – звезда и треугольник. При схеме звезд (Y) (рис. 1.4, б) концы обмоток x, y, z соединяются в общую нулевую точку, начала a, b и c подсоединяют к внешней цепи; при схеме треугольник (Δ) (рис. 1.4, в) поочередно соединяют начала и концы обмоток фаз. ГОСТом рекомендуются следующие схемы соединения обмоток: Y/Y 0 , Y/Δ и Y 0 /Δ ; для трансформаторов малой мощности допускаются также схемы Δ/Δ , Δ/Y и Δ/Y 0 .Схема Y 0 означает соединение звездой с выведенной нулевой точкой. У трехфазных трансформаторов наряду с рекомендуемой схемой соединения обмоток указывается номер группы (от 0 до 12) трансформатора, соответствующий данной схеме. Группа характеризует сдвиг по фазе между первичным и вторичным линейными напряжениями трансформатора. Для параллельной работы должны подключаться трансформаторы, имеющие одинаковое выходное напряжение и принадлежащие к одной группе, чтобы не возникали уравнительные токи из-за разницы фаз выходных напряжений.


Рис.1.4

Трехфазные трансформаторы широко используются в качестве трансформаторов статических преобразователей, применяемых для питания электроприводов.

Импульсные трансформаторы.
Импульсные трансформаторы применяют в радиоэлектронике и вычислительной технике для преобразования кратковременных сигналов с крутыми фронтами, в основном прямоугольных импульсов длительностью до долей микросекунды. Основное требование, предъявляемое к импульсным трансформаторам, заключается в минимальном искажении формы импульсов и снижении длительности фронтов импульсов. Искажение объясняется нелинейностью кривой намагничивания материала магнитопровода, наличием потоков рассеяния обмотки и увеличивающимся, по мере возрастания частоты импульсов, влиянием вихревых токов в магнитопроводе и паразитных межвитковых и межобмоточных емкостей. В частности, электромагнитная постоянная времени трансформатора, определяющая длительность фронтов импульса, тем больше, чем больше индуктивность рассеяния, паразитная емкость обмоток и вихревые токи. Уменьшение рассеяния в импульсных трансформаторах достигается использованием кольцевых магнитопроводов, уменьшение вихревых токов – использованием магнитопроводов из феррита или тонкой пермаллоевой ленты, уменьшение емкости – специальной схемой укладки проводов и металлическими экранами. Линейность намагничивания обеспечивается выбором соответствующего материала магнитопровода и малыми значениями индукции.
Следует иметь в виду, что трансформация прямоугольных импульсов возможна только в том случае, если длительность импульсов t и значительно меньше полной электромагнитной постоянной времени первичной обмотки. Это означает, что намагничивающий ток и магнитный поток за время tи не будут достигать установившегося значения. В противном случае в трансформаторе установится постоянный поток и выходная ЭДС будет равна нулю.


Рис.1.5

Принцип передачи прямоугольного импульса напряжения через трансформатор (рис. 1.5) рассмотрим, считая трансформатор идеальной индуктивностью с потоком Ф0, замыкающимся только по магнитопроводу. В этом случае u 1 ≈ -e 1 и, аналогично (1.4), проинтегрировав, при u 1 =U 1 =const получим закон изменения потока в пределах импульса:

Ф 0 =∫(u 1 /w 1 )dt= U 1 t/w 1 (1.11)

т.е. поток нарастает в пределах импульса по линейному закону. Подставив (1.11) в (1.1) для e 2 , получим

e 2 = – U 1 w 2 /w 1 = – U 1 /K т (1.12)

т.е. функция e 2 (t) представляет собой прямоугольный импульс. В действительности по указанным выше причинам закон изменения выходной ЭДС и напряжения отличается от прямоугольного (кривая e 2д ).

Трансформаторные будки есть практически на каждой улице любого города вне зависимости от размеров. Вся планета подвержена власти электричества. Что такое силовой трансформатор? Для чего они? Принцип работы силового трансформатора? При должном объяснении все станет понятно любому школьнику.

Зачем это нужно?

Трансформатор служит для повышения или понижения подаваемой электроэнергии. Зачем нужно преобразовывать ток? Смысл в том, что согласно закону Джоуля-Ленца тепло, которое выделяет проводник при прохождении по нему электрического тока выделяется в зависимости от силы тока. Причем зависимость эта квадратичная, так как сила тока в формуле имеет вторую степень.

На практике это означает, что увеличение силы тока в 2 раза приведет к увеличению тепловыделений в 4 раза. Все бы ничего, но закон сохранения энергии пока никто не отменял. На нагрев проводника расходуется электроэнергия, которую с таким трудом добывает человечество. Единственный выход: повысить напряжение до максимум.

Согласно закону Ома всегда сохраняется некое равенство: произведение силы тока на сопротивление равняется напряжению в сети. Предположим, что сопротивление не изменяется, так как оно зависит от свойств проводящего материала. Тогда единственным выходом будет максимально задрать напряжение, чтобы уменьшить силу тока в сети.

Высоковольтные линии придумали не ради развлечения. Единственная цель столь сложной системы с трансформаторами: максимальное сокращение потерь.

Принцип работы силового трансформатора

Чтобы говорить о принципе работы силового трансформатора требуется вспомнить некоторые понятия из школьного курса физики. В итоге будет проще понять объяснения рабочей схемы устройства.

Индукция

Чтобы понять, как работает силовой трансформатор, надо разбираться в понятии индукции. Именно на ней основана львиная доля современной электроники. Суть этого явления в том, что при прохождении через проводник ток создает переменное электрическое поле. Движение электронов в свою очередь порождает переменное магнитное поле, которое при попадании в другой проводник породит так переменное электрическое поле.

То есть, если поставить рядом два проводника, причем один из них подключить к источнику тока, а другое не подключать – электричество будет течь в обоих проводниках. Причем во втором проводнике направление тока будет противоположным таковому в исходном варианте.

Свойство индукции используется достаточно часто: в усилителях, передатчиках и, конечно, школьных опытах

Устройство трансформатора

Корпус аппарата представляет собой бак, в который заливается масло. Масло насыщается минералами, чтобы лучше отводить тепло. Выбросы тепловой энергии при работе трансформатора огромны. Однако даже такие потери в тысячи раз меньше возможных утечек энергии при транспортировке.

Масло циркулирует по внутреннему и внешнему контуру трансформатора. Отдельно отметим, что внешний контур часто представляет собой оребренный радиатор. Увеличение площади теплоотдачи приводит к улучшению отдачи тепла. Проще говоря, чем больше площадь соприкосновения масла из внутреннего контура и внешнего радиатора – тем лучше будет отводится тепло, тем меньше вероятность аварии на трансформаторной подстанции.

Само устройство силового трансформатора представляет собой квадратного сечения сердечник, набранный из тонких электростальных пластинок. Используются именно наборные сердечники, чтобы свести к минимум появление самоиндукционных токов, которые приводят к перегреву и увеличению потерь энергии.

На противоположные стороны квадрата наносят обмотку. Обмотка, на которую поддается ток, называется первичной, обмотка, отдающая преобразованную энергию, вторичной.

Принцип работы

Схема работы силового трансформатора выглядит так:

  1. Ток подается на первичную обмотку.
  2. Первичная обмотка в результате прохождения электрического тока начинает генерировать переменное магнитное поле.
  3. Магнитное поле, проходящее сквозь вторичную обмотку, вызывает в ней электрический ток.

Вес секрет процесса в количестве витков. Отношение принятого напряжения к отданному равняется отношению количества витков первичной обмотки к количеству витков вторичного обмотки. Это же отношение называют коэффициентом трансформации. То есть коэффициент показывает, во сколько раз уменьшится или увеличится выходное напряжение на подстанции.


Схема простейшего трансформатора

Почему трансформатор называют силовым

Как мы уже сказали, силовые трансформаторы используют для понижения высоковольного тока до приемлемых для города параметров, то есть 220/360 В – в зависимости от местности и прочих условий. Но нужно отметить, что напряжение высоковольтных линий ненамного больше 1000 к В, а это больше миллиона вольт. Именно за трансформацию столь сильного напряжения, устройство и назвали таким красивым именем.


Установленный силовой трансформатор

Именно силовые трансформаторы используются для преобразования электричества городских и квартальных сетей. Получается многоступенчатая система снабжения страны электроэнергией:

  1. Сначала повышающие трансформаторы увеличивают напряжение до огромных значений
  2. По проводам ток течет в города и села
  3. Понижающие трансформаторы понижают напряжение сначала до общегородских, а потом и до квартальных значений.

Отдельно нужно сказать, что иногда приходится понижать значение напряжения до 360 В в городе, потому что высоковольтные линии проводить в городской черте запрещено.

Виды трансформаторов

Уже были названы повышающие и понижающие трансформаторы. В зависимости от места использования можно выделить сетевые и силовые аппараты. Сетевые трансформаторы используются в устройствах, поскольку даже квартальные параметры тока слишком высоки для простого телевизора или ноутбука. Поэтому используется трансформатор, чтобы преобразовать ток в подходящий для конкретного предмета бытовой техники.

Сразу использовать маленькие параметры в городе нельзя из тех же соображений экономии. К тому же, разные приборы требуют разных параметров – всем производителям электроники не угодишь, а потому проще каждому встраивать в свой прибор трансформатор.

Отдельной строкой идут автомобильные трансформаторы, которые позволяют заводить машину с использованием небольшого электрического импульса. Выделяют и импульсные и многие другие трансформаторы, но всех их объединяет одно: принцип работы. Отличия кроются только в рабочих параметрах тока и предназначении трансформатора.


Сетевой трансформатор

Контроль работы устройства

Во время сервисных работ строго запрещается заглядывать внутрь бака, сливать полностью масла и проводить какие-либо манипуляции с содержимым корпуса трансформатора. Работоспособность изделия проверяется путем химической оценки пробы масла и холостого подключения аппарата. В результате удается узнать, насколько трансформатор работоспособен в данный момент времени.

Даже к месту монтажа привозят уже готовую конструкцию, которую остается только подключить к сети. Заливка маслом производится на заводе, не говоря уже о более сложных процедурах. Для доставки оборудования используется специализированная техника.

Тяговые типы трансформаторов устанавливаются на подстанциях, питающих электротранспорт. Оборудование используется на железной дороге, при работе трамваев, троллейбусов и поездов метрополитена. Подстанции с разным количеством трансформаторов используются на узлах подачи питания к подземному и наземному транспорту.

Применяются конструкции, состоящее из одного или нескольких агрегатов. Одноагрегатные подстанции используются на участках с централизованным снабжением. Линия обесточивается полностью при необходимости технического обслуживания неисправных подстанций.

Конструкция

Строение простого трансформатора:

  • Сердечник.
  • Обмотки для высокого и низкого напряжения, не соединенные друг с другом, отличающиеся количеством витков.
  • Шихтованный магнитопровод и несколько обмоток входят в активную часть устройства.

Магнитопровод сконструирован из пары горизонтальных ярм и 2-х вертикальных стержней. Стержни собираются из нескольких сжатых стальных листов, используемых в электротехнике. Собираются пакеты разной ширины с изменяющимся сечением, приближенным по форме к круглому. Шпильки используются для сцепки листов, их изоляция обеспечивается бакелитовыми трубками, а под гайки ставятся шайбы из этого материала.

Ярма изготовлены из стальных листов, во время их сборки по бокам крепятся швеллера, соединенные болтами, ввинченными в торцы железных планок. Ярма соединены стальными стержнями магнитопровода.

Две силовые планки крепятся снизу к паре швеллеров, они создают опору для активной части трансформатора и прилегают ко дну бака. Швеллера, установленные на верхнем ярме, соединяются с крышкой с помощью болтов через овальные отверстия. Поэтому активная часть располагается внизу бака, а ее крышка прижимается к фланцам. Между металлическими элементами устанавливаются эластичные прокладки, не пропускающие масло.

Принцип действия

Главный принцип работы тяговых трансформаторов – это взаимная индукция. Электричество к обмоткам передается от главного источника. Переменный ток направляется на потребляющее устройство через зажимы обмотки.

Тяговые трансформаторы для тяговых подстанций регулируют до нужного уровня напряжение, подающееся на потребители электроэнергии. Настраивают выходное напряжение в зависимости от режима работы двигателей.

Схема соединения обмоток

В трансформаторе установлены три обмотки: первичная и две вторичные. Первая вторичная обеспечивает собственные потребности устройства, состоит из 22 витков и питает вспомогательное оборудование, а также основную вторичную обмотку. Обмотка собрана из двух нерегулируемых элементов из 20 витков и пары регулируемых. Они делятся на 4 секции по 5 витков, в каждой из них устанавливается ЭДС по 145 В.

Прогулка наматывается на 6 цилиндров, установленных на паре вертикально расположенных стержней.

Нерегулируемые элементы вторичной обмотки находятся на внутренних цилиндрах.

Условные обозначения начала и конца обмотки выражаются на схеме первыми и последними символами латинского алфавита. Прописные буквы применяются для обмотки с высоким напряжением, элементы, проводящие низкий ток, отмечаются строчными.

Обмотки на стержнях фиксируются на нескольких изоляционных цилиндрах с применением картонных прокладок или реек. Прокладки постепенно усаживается при использовании устройства. Деталь в форме наклонной штанги применяется для улучшения осевой стяжки. Один конец крепится на ярмовой балке, а другой соединяется с подвижным башмаком, установленным на присущим кольце.

Как выглядят матки скрепляются с двумя группами с помощью проводов группового переключателя. Обе группы через выпрямительное устройство соединяются с двигателем. Нерегулируемые элементы спиральных обмоток установлены возле сердечника. В центре находится сетевая непрерывная обмотка, эти элементы в обоих сердечниках соединяются параллельно. Дисковые катушки подвижной части находится на внешнем цилиндре.

Стальные шайбы крепится на магнитопровод при сборке активной части без верхнего ярма. Текстолитовые бруски ставятся веером на шайбы для того, чтобы масло протекало под обмоткой. Текстолитовые кольца ложатся на верхний виток на всех цилиндрах. Веером на них устанавливаются бруски, выводящие масло. На них крепятся металлические шайбы.

Назначение тяговых трансформаторов

Техника для тяговых подстанций делятся на три группы:

  • Для метрополитена.
  • Для железнодорожного сообщения.
  • Длина земного транспорта в черте города.

Силовые трансформаторы тяговых подстанций отличаются несколькими особенностями. На их конструкцию влияет сфера применения и назначение. Агрегаты, установленные в трамваях, троллейбусах и поездах, значительно отличаются. Подстанции, обеспечивающие работу железнодорожного транспорта, находятся на расстоянии 25-50 км. Специальные требования выполняются при проектировании сети.

Профиль железнодорожного сообщения, эксплуатируемые транспортные средства, влияют на создание технологических карт и размещение трансформаторов.

Режим работы и типы, применяемые на тяговой подстанции

Трансформаторы для тяговых подстанций переменного тока делятся на группы с учетом условий эксплуатации.

Устройство, которое устанавливается на железнодорожных сообщениях:

Опорные устройства применяются для питания других объектов. Тупиковые снабжаются электричеством от соседних трансформаторов, промежуточное устанавливаются между двумя соседями подстанциями.

Специальные виды используются для городского транспорта. Первая группа устройств требует регулярного обслуживания. Вторая работает полностью в автоматическом режиме. Действие третьего вида трансформаторов регулируется с помощью телеуправляемой техники, поэтому и поддержка таких устройств не требует работы обслуживающего персонала.

Изделия для метрополитена:

  • Тяговые.
  • Понизительные.
  • Тягово-понизительные.

Понизительные снабжаются электричеством от городских сетей. Понизительные уменьшают напряжение до 400-220 вольт, питают силовые установки и освещение. Подстанции уменьшают напряжение до необходимого уровня.

Силовые трансформаторы. Устройство трансформатора силового сухого/масляного

 

Силовой трансформатор – это электротехническое оборудование. Он изменяет напряжение переменного электрического тока. Если на входе в трансформатор ток имеет более высокое напряжение, чем на выходе – то перед вами силовой понижающий трансформатор. Если из устройства выходит ток с более высоким напряжением, чем на входе – то трансформатор повышающий. Частота тока на входе и на выходе не меняется.

Работа трансформатора основана на электромагнитной индукции. Суть явления индукции: если через замкнутый контур пропускать магнитный поток, то в контуре возникнет электрический ток. Электромагнитную индукцию в 1831 году открыл знаменитый английский ученый Майкл Фарадей.

 

 

 Устройство силового трансформатора сухого и масляного

Любой трансформатор состоит их магнитопровода, обмоток, системы охлаждения, регулирующих и контролирующих устройств.

Обмотки намотаны на сердечник из специальной электротехнической стали.

Сердечники бывают стержневые, броневые и тороидальные. В трансформаторах стержневого типа обмотка наматывается на весь сердечник. Поэтому вы видите только верхнюю и нижнюю части электромагнитного стержня. Если сердечник броневой – то обмотка почти полностью скрыта внутри сердечника. Тороидальный сердечник – это тот же стержень, но замкнутый в кольцо. Отец трансформатора Фарадей именно с помощью тороидальной катушки открыл электромагнитную индукцию.

Без системы охлаждения силовой трансформатор работать не может. Потому что под нагрузкой нагревается рабочая часть устройства – сердечник и обмотка на нем. Охлаждается трансформатор воздухом или маслом. Соответственно по способу охлаждения выделяют типы силовых трансформаторов: сухие и масляные.

Регулирует работу устройства специалист. Для этого на силовом трансформаторе производитель устанавливает реле и различные переключатели. Некоторые модели трансформаторов можно регулировать под нагрузкой, другие – только в выключенном состоянии.

Контролирует работу трансформатора инженер-электрик. Он следит за показателями датчиков температуры и давления внутри трансформатора.

Конструкция сухого силового трансформатора

Магнитопровод и обмотки есть во всех трансформаторах. Главное отличие между сухими и масляными трансформаторами в системе охлаждения.

  • В сухом трансформаторе нагретый воздух от магнитопровода и катушек движется естественным путем или его «гоняют» специальные вентиляторы.
  • В защитном кожухе сухого трансформатора делают специальные отверстия для лучшей вентиляции. Потому что воздушное охлаждение менее эффективно, чем масляное. Иногда ТС выпускаются в незащищенном исполнении.
  • К изоляции в сухих трансформаторах предъявляются повышенные меры пожарной безопасности. Потому что основная изолирующая среда для устройства – это воздух. А изолирующие свойства у воздуха хуже, чем у масла.

В сухих трансформаторах нет жидкостей. Поэтому обслуживать оборудование не так хлопотно. Кроме того, отсутствие масла в системе охлаждения позволяет устанавливать трансформатор рядом с потребителями электрической энергии.

Устройство трансформатора силового масляного

Рабочая часть масляного силового трансформатора состоит из сердечника и обмоток. А охлаждается трансформатор маслом. Его заливают в специальный бак с крышкой. Сверху на крышке расположены датчики давления и температуры масла, входы и выходы обмоток ВН и НН, регуляторы и переключатели.

Трансформаторы отличаются по конструкции масляного бака. Есть герметичные масляные силовые трансформаторы ТМГ. В них устанавливают бак с гофрированными стенками. Масло заливается в бак в вакууме. Оно не соприкасается с окружающей средой. Масляный силовой трансформатор обычной конструкции имеет на крышке расширитель и газовое реле. При сильном нагреве дополнительный объем масла поступает в расширитель.

Масляная система в состоянии охладить мощный трансформатор. Но масло – это горючая жидкость. Поэтому «начинка» масляного трансформатора спрятана в прочный корпус.

Силовые трансформаторы – это габаритные устройства. Для удобного ремонта и установки их комплектуют дополнительными устройствами. Например, колесиками или дополнительными датчиками.

 

Блок в футере (ru)

Самарская область

Азербайджан

Армения

Белоруссия

Грузия

Дальнее Зарубежье

Казахстан

Киргизия

Молдавия

Монголия

Прибалтика

Таджикистан

Туркменистан

Узбекистан

Украина

Москва

Санкт-Петербург

Алтайский край

Амурская область

Архангельская область

Aстраханская область

Белгородская область

Брянская область

Владимирская область

Волгоградская область

Вологодская область

Воронежская область

Еврейская автономная область

Забайкальский край

Ивановская область

Иркутская область

Кабардино-Балкарская Республика

Калининградская область

Калужская область

Камчатский край

Карачаево-Черкесская республика

Кемеровская область

Кировская область

Костромская область

Краснодарский край

Красноярский край

Курганская область

Курская область

Ленинградская область

Липецкая область

Магаданская область

Московская область

Мурманская область

Ненецкий автономный округ

Нижегородская область

Новосибирская область

Омская область

Оренбургская область

Орловская область

Пензенская область

Пермский край

Приморский край

Псковская область

Республика Адыгея

Республика Алтай

Республика Башкортостан

Республика Бурятия

Республика Дагестан

Республика Ингушетия

Республика Калмыкия

Республика Карелия

Республика Коми

Республика Марий Эл

Республика Мордовия

Республика Саха (Якутия)

Республика Северная Осетия-Алания

Республика Татарстан (Татарстан)

Республика Тыва

Республика Хакасия

Ростовская область

Рязанская область

Самарская область

Саратовская область

Сахалинская область

Свердловская область

Смоленская область

Ставропольский край

Новгородская область

Тамбовская область

Тверская область

Томская область

Тульская область

Тюменская область

Удмуртская республика

Хабаровский край

Ханты-Мансийский автономный округ

Челябинская область

Чеченская Республика

Чувашская республика (Чувашия)

Чукотский автономный округ

Ямало-ненецкий автономный округ

Ярославская область

Устройство сварочного трансформатора: принцип действия, работы

Для выполнения сварочных работ вы выбрали самый простой, из ныне существующих (по сравнению с выпрямителем или инвертором), источник сварочного тока. И правильно поступили!

Ведь, не так давно сварщики пользовались только аналогичным оборудованием, и всё у них получалось. А мы чем хуже? Чтобы использовать все возможности этого гаджета, необходимо знать его устройство и принцип действия.

В помощь вам, мы расскажем про устройство сварочного трансформатора, принцип его действия и некоторые технологические секреты.

Устройство сварочного трансформатора

Рассмотрим подробнее сварочный трансформатор: устройство и принцип действия. Регулировка тока в сварочном трансформаторе (далее – СТ) осуществляется по двум основным схемам:

  1. В первом случае, применяется трансформатор с нормальным рассеянием магнитного поля, которое осуществляется совмещённым или отдельным дросселем. Непосредственно сама регулировка сварочного тока производится изменением воздушного зазора в магнитопроводе дросселя;
  2. Во втором случае, регулировка гаджета осуществляется за счет управления рассеянием магнитного поля. Этот процесс может осуществляться следующими методами:
  • изменением размеров воздушного промежутка между первичной и вторичной обмотками;
  • согласованным изменением числа витков первичной и вторичной обмоток;
  • применением подмагничиваемого шунта. Он изменяет магнитную проницаемость между стержнями магнитопровода, чем и осуществляется регулировка сварочного тока.

Конструкция и органы управления однопостовым сварочным трансформатором с подвижными обмотками (т. е. работающим по первой схеме) приведены на рисунке.

Органы управления сварочным трансформатором. Ист. http://moiinstrumenty.ru/svarochnyj/svarochnyi-transformator-svoimi-rukami.html.

Магнитопровод с катушками и механизмами помещается в защитный кожух, который имеет жалюзи для охлаждения. Регулировка величины сварочного тока в таком СТ осуществляется с помощью подвижной обмотки, которая перемещается посредством ходовой гайки и вертикального винта с ленточной резьбой. В движение последний приводится при помощи рукоятки.

Сварочные провода подключаются к специальным зажимам. СТ представляет собой массивную конструкцию (очень тяжёлый сердечник). Поэтому, для погрузо-разгрузочных работ, он оснащён рым-болтом, а для перемещения по рабочему объекту – транспортной тележкой и ручкой.

Принцип действия

Чтобы понять принцип работы СТ, давайте, хотя бы в самых общих чертах, рассмотрим физические процессы, происходящие в однофазном двухобмоточном трансформаторе. Для иллюстрации этих процессов воспользуемся рисунком.

Физические процессы в трансформаторе. Ист. http://moiinstrumenty.ru/svarochnyj/svarochnyi-transformator-svoimi-rukami.html.

Электромагнитная схема такого трансформатора состоит из двух обмоток (первичная и вторичная), размещенных на замкнутом магнитопроводе. Последний выполнен из ферромагнитного материала, что позволяет усилить электромагнитную связь между этими обмотками. Происходит это за счёт уменьшения магнитного сопротивления контура (замкнутой цепи), по которому проходит магнитный поток трансформатора (Ф).

Первичную обмотку подключают к источнику переменного тока, вторичную – к нагрузке. При подключении к источнику электропитания, в первичной обмотке появляется переменный ток i1. Этот электрический ток создаёт переменный магнитный поток Ф, замыкающийся по магнитопроводу. Поток Ф индуцирует в обеих обмотках переменные электродвижущие силы (далее – ЭДС): е1 и е2.

Эти ЭДС, согласно закону Максвелла, пропорциональны числам витков N1 и N2 соответствующей обмотки и скорости изменения потока dФ/dt. Если пренебречь падением напряжения в обмотках трансформатора (они обычно не превышают 3…5 % от номинальных значений U1 и U2), то можно считать: e1≈U1 и e2≈U2. Тогда, путём несложных математических преобразований, можно получить связь между напряжениями и количеством витков обмоток: U1/U2 = N1/N2.

Таким образом, подбирая числа витков обмоток (при заданном напряжении U1) можно получить желаемое напряжение U2:

  • при необходимости повысить вторичное напряжение – число витков N2 берут больше числа N1. Такой трансформатор называют повышающим;
  • при необходимости уменьшить напряжение U2 – число витков N2 берут меньшим N1. Такой трансформатор называют понижающим.

Теперь мы можем, непосредственно, рассмотреть принцип действия СТ. Как сказано выше, он заключается в преобразовании входного напряжения (220В или 380В) в более низкое, которое в режиме холостого хода равно примерно 60В. Когда мы рассматриваем сварочный трансформатор, принцип работы будет очевиден после знакомства с компоновкой и функциональной схемой СТ.

Компоновка узлов СТ (в качестве примера предлагается агрегат серии «ТДМ») представлена на рисунке.

Устройство сварочного трансформатора. Ист. http://stroysvarka.ru/kak-ustroen-svarochnyj-transformator-dlya-poluavtomata/.

Пояснения к схематическому изображению сварочного трансформатора:

  • 1 – первичная обмотка трансформатора. Выполнена из изолированного провода;
  • 2 – вторичная обмотка не изолирована («голая» проволока) для улучшения теплопередачи. Кроме того, для улучшения охлаждения имеются воздушные каналы;
  • 3 – подвижная часть магнитопровода;
  • 4 – система подвеса трансформатора внутри корпуса агрегата;
  • 5 – механизм управления воздушным зазором;
  • 6 – ходовой винт. Основной элемент управления воздушным зазором;
  • 7 – рукоятка привода ходового винта.

Функциональная схема такого СТ представлена на рисунке.

Функциональная схема сварочного трансформатора с зазором магнитопровода. Ист. http://www.studfiles.ru/preview/3997689/.

Трансформатор состоит из:

  1. магнитопровода с зазором б;
  2. первичной обмотки I;
  3. вторичной обмотки II;
  4. обмотки реактивной катушки IIк.

Регулировка величины сварочного тока осуществляется изменением величины зазора в магнитопроводе. Размер зазора влияет на изменение магнитного сопротивления контура и, соответственно, величину магнитного потока, который и создаёт в обмотках электрический ток:

  • при необходимости уменьшить величину сварочного тока – величину зазора увеличивают;
  • при необходимости увеличить величину сварочного тока – величину зазора уменьшают.

Полезное видео

Посмотрите небольшой обучающий ролик об устройстве и принципе действия трансформатора:

Магнитопровод

Магнитопровод – это центральная часть конструкции СТ. Он является сердечником понижающего трансформатора и играет основную роль в формировании сварочного тока. По нему протекает магнитный поток, который индуцирует (создаёт) электрическое напряжение на всех обмотках.

Магнитопровод сварочного трансформатора представляет собой пакет пластин из трансформаторной стали. Вызвано это тем, что под воздействием магнитного потока в нём наводятся вихревые замкнутые электрические токи (в честь французского физика, их открывшего, названы: токи Фуко). В соответствии с правилом Ленца, магнитное поле этих токов стремиться уменьшить индукцию поля его создавшего, т. е. полезного. В результате:

  1. уменьшается КПД СТ;
  2. токи Фуко нагревают материал сердечника.

Для уменьшения этого влияния принимаются меры по уменьшению этих токов. Поэтому, как было сказано выше, магнитопровод и представляет собой пакет пластин. Поверхности пластины имеют хорошую электроизоляцию (они имеют оксидное изоляционное покрытие) и, кроме этого, часто дополнительно покрываются электроизолирующим лаком. Благодаря этому, они не представляют собой сплошной проводник, что существенно уменьшает величину токов Фуко.

Пластины между собой стягиваются шпильками в плотный пакет. Если этого не сделать (или стянуть неплотно), то они вибрируют с частотой колебаний тока в источнике питания: 50 Гц. В результате, СТ «гудит» с такой частотой.

Ограничитель холостого хода

Ограничитель напряжения холостого хода СТ применяется, в соответствии со своим наименованием, для автоматического ограничения этого параметра. Он уменьшает индуцированную при размыкании вторичной обмотки ЭДС до безопасного значения не позже, чем через одну секунду после разрыва сварочной цепи. На картинке изображена популярная модель ограничителя напряжения холостого хода однофазных сварочных трансформаторов «ОНТ-1».

Ограничитель напряжения холостого хода СТ «ОНТ-1». Ист. http://kiev.kv.besplatka.ua/obyavlenie/ont-1-ogranichitel-napryazheniya-holostogo-hoda-f1bc31.

Принцип действия ограничителя следующий. Мы уже знаем, что в случае разрыва сварочной цепи, резко изменяется величина магнитного потока в магнитопроводе. Это, в свою очередь, приводит к резком скачку ЭДС самоиндукции. Резкий рост величины электрического напряжения может стать причиной аварии СТ или поражения током сварщика. Ограничитель напряжения холостого хода сварочного трансформатора уменьшает эту ЭДС до безопасного значения – не более 12 В.

Все про трехфазные трансформаторы: строение, виды, принцип работы

15.03.2019

Трехфазный трансформатор это специализированное устройство для изменения величины напряжения в сети трехфазного переменного тока. Главный принцип работы трансформатора основан на эффекте электродвижущей силы (ЭДС) и электромагнитной индукции, что позволяет исключить гальваническую связь между обмотками высокого и низкого напряжения.

Конструктивные особенности

Трехфазные трансформаторы состоят из следующих основных конструктивных частей:

  • Магнитопровод. Обеспечивает место для фиксации обмоток и создает направление для магнитного потока.
  • Обмотка высокого и низкого напряжения. Представляют собой изолированные друг от друга обмотки из меди или алюминия, которые предназначены для создания магнитного потока.
  • Высоковольтные вводы. Обеспечивают безопасный ввод/вывод высокого напряжения на соответствующие обмотки.
  • Низковольтные выводы. Обеспечивают безопасное подключение линий электропередач к обмоткам низкого напряжения.
  • Трансформаторный бак. Является обязательным элементом масляных трансформаторов, который создает все условия для работы магнитопровода с обмотками в трансформаторном масле.
  • Устройство переключения (РПН или ПБН). Специальные устройства для изменения параметров первичной обмотки с целью поддержания стабильной величины напряжения на вторичной обмотке.
  • Приборы контроля и сигнализации. Они обеспечивают безопасный и стабильный режим работы основного электрооборудования, а также оповещение о наличии отклонений.

Схема трехфазного трансформатора подбирается с учетом рабочих параметров электрической сети, требований потребителей электроэнергии и бюджета затрат.

Разновидности

Все трехфазные трансформаторы классифицируют по многочисленным критериям:

  1. Схема соединения обмоток: звезда, треугольник, зигзаг.
  2. Группа соединения обмоток.
  3. Тип подключения трехфазного трансформатора к нейтрали.
  4. Основное назначение: понижающие, повышающие, измерительные, для защиты сети, промежуточные.
  5. Тип изоляции обмоток: масляные, с сухой изоляцией,
  6. Материал для обмоток: медь, алюминий.
  7. Величина номинального напряжения: высоковольтные, низковольтные.
  8. Конструкция магнитопровода: стержневой, броневой, бронестержневой.

Электротехническая компания «ЭЛЕКОМ» реализует широкую номенклатуру трехфазных трансформаторов от зарубежных и отечественных производителей. Мы предоставляем изделия, которые в полной степени соответствуют всем международным стандартам качества.

https://elekom.ru/catalog/silovye-transformatory

Устройство и принцип действия измерительных трансформаторов тока

Трансформатор тока состоит из замкнутого сердечника, набранного из тонких листов электротехнической стали, и двух обмоток — первичной и вторичной. Первичную обмотку включают последовательно в контролируемую цепь, ко вторичной обмотке присоединяют токовые катушки различных приборов и реле.

Рисунок 1 – Трансформатор тока:
а — устройство, б, в — схемы включения амперметра непосредственно в контролирующую цепь и через трансформатор тока
Устройство трансформатора тока и схемы включения амперметра показаны на рисунке 1, а—в. Магнитный поток в магнитопроводе 3 создается токами первичной 1 и вторичной 2 обмоток. Соотношение первичного I1 и вторичного I2 токов определяется формулой:

где KТТ — коэффициент трансформации; w1 и w2 — число витков первичной и вторичной обмоток.
Если в силовых трансформаторах и трансформаторах напряжения увеличение сопротивления во вторичной цепи вызывает уменьшение тока во вторичной и в первичной цепях, а напряжение на выводах обеих обмоток почти не изменяется, то у трансформаторов тока увеличение сопротивления во вторичной цепи приводит к повышению напряжения на выводах вторичной обмотки. Это объясняется тем, что ток в первичной цепи не зависит от нагрузки трансформатора тока. Ток во вторичной цепи трансформатора тока практически не меняется с изменением ее сопротивления при данном режиме первичной цепи. Вследствие этого нагрузка трансформатора тока увеличивается с возрастанием сопротивления во вторичной цепи, складывающегося из сопротивлений, подключенных к трансформатору тока аппаратов и приборов, соединительных проводов и переходных контактов.
Трансформаторы тока для электроустановок напряжением до 1000 В показаны на рисунке 2, а, б, в (катушечный, шинный ТШ-0,5 и шинный с литой изоляцией ТШЛ-0,5). В шинных трансформаторах тока в качестве первичной обмотки используют шину, пропускаемую через окно 5 сердечника трансформатора тока, на который намотана вторичная обмотка.

Рисунок 2 – Трансформаторы тока на напряжение до 1000 В:
а — катушечный, б, в — шинные ТШ-0,5 и ТШЛ-0,5; 1 — каркас, 2, 4 — зажимы вторичной и первичной обмоток, 3 — защитный кожух, 5 — окно



Рисунок 3 – Трансформаторы тока на напряжение 10 кВ с литой изоляцией:
а — многовитковый ТПЛ-10, б — одновитковый ТПОЛ-10, в —шинный ТПШЛ-10; 1, 2 — зажимы первичной и вторичной обмоток, 3 — литая изоляция, 4 — установочный угольник, 5 — сердечник

Рисунок 4 – Опорный трансформатор тока ТФНД-220 наружной установки
Проходные трансформаторы тока для внутренней установки на напряжение 10 кВ выполняют многовитковыми, одновитковыми и шинными с фарфоровой и пластмассовой (литой) изоляцией (Рисунок 3, а—в).


Рисунок 5 – Трансформаторы тока:
а — проходной ТПФМ-10 на 10 кВ, б — опорный ТФН-35М на 35 кВ; 1 и 3 — первичная и вторичная обмотки, 2 — фарфоровый изолятор, 4 — сердечник вторичной обмотки, 5 — контактный угольник, 6 — крышка, 7 — кожух, 8 — верхний фланец, 9 — зажимы выводов вторичной обмотки, 10 — якореобразный болт, 11 — крышка, 12 — фарфоровая покрышка, 13 — изоляционное масло, 14 — кольцевые обмотки («восьмеркой»), 15 — полухомут, 16 — масловыпускатель, 17 — цоколь, 18 — коробка вторичных выводов, 19 — кабельная муфта, 20 — маслоуказатель
Опорный трансформатор тока ТФНД-220 для наружной установки на напряжение 220 кВ (Рисунок 4) имеет обмотки, помещенные в фарфоровый корпус 3, залитый маслом и укрепленный на основании 4. На верхнем торце фарфорового корпуса укреплен чугунный расширитель 1 для масла с маслоуказателем и зажимами 2 первичной обмотки. Сердечник с вторичной обмоткой охватывается первичной обмоткой, имеющей в этом месте форму кольца. Выводы вторичной обмотки размещены в коробке 5 на основании трансформатора.
В высоковольтных распределительных устройствах подстанций применяют проходные (Рисунок 5, а) и опорные (Рисунок 5, б) трансформаторы тока.
1.4 Электрическая принципиальная схема
Для питания вторичных устройств используют различные схемы соединения вторичных обмоток трансформаторов тока. Соединение в звезду (Рисунок 6, а) применяют при необходимости контроля тока во всех трех фазах электрической сети, соединение треугольником (Рисунок 6, б) — при получении большей силы тока во вторичной цепи или сдвига по фазе вторичного тока относительно первичного на 30 или 330°.
В сетях с изолированной нейтралью используют соединение вторичных обмоток измерительных трансформаторов тока в неполную звезду (Рисунок 6, в) и на разность токов двух фаз (Рисунок 6, г), а для питания защит от замыкания на землю — схему соединения на сумму токов трех фаз (схема фильтра токов нулевой последовательности). Токовое реле, включенное на выходе цепей, собранных по такой схеме (Рисунок 6, д), не реагирует на междуфазовые короткие замыкания, но приходит в действие при всех видах повреждений, связанных с замыканием элементов электрической сети на землю.

Рисунок 6 – Схемы соединений вторичных обмоток трансформаторов тока:
а — звездой, б — треугольником, в — неполной звездой, г – на разность токов двух фаз, д — на сумму токов трех фаз, е — последовательное, ж— параллельное
Последовательное соединение вторичных обмоток трансформаторов тока одной фазы (Рисунок 6, е) позволяет получить от них суммарную мощность, а параллельное (Рисунок 6, ж) — уменьшить коэффициент трансформации, суммируя ток вторичных обмоток при данном токе в линии.

Конструкция и использование трансформаторов - Что происходит внутри электрогенератора? - Высшее - OCR 21C - Редакция GCSE Physics (Single Science) - OCR 21st Century

Трансформатор - это устройство, которое может изменять разность потенциалов или напряжение переменного тока:

  • повышающий трансформатор увеличивает разность потенциалов
  • понижающий трансформатор уменьшает разность потенциалов

Конструкция трансформатора

Базовый трансформатор состоит из двух витков провода; первичная катушка от входа переменного тока и вторичная катушка, ведущая к выходу переменного тока.Катушки электрически не связаны. Вместо этого они намотаны на железный сердечник. Он легко намагничивается и может переносить магнитные поля от первичной катушки ко вторичной катушке.

Компоненты трансформатора

Когда трансформатор работает:

  1. Первичная разность потенциалов управляет переменным током через первичную катушку
  2. ток первичной катушки создает магнитное поле, которое изменяется по мере изменения тока
  3. железный сердечник увеличивается сила магнитного поля
  4. изменяющееся магнитное поле индуцирует изменяющуюся разность потенциалов (напряжение) во вторичной катушке
  5. индуцированная разность потенциалов создает переменный ток во внешней цепи

Трансформаторы могут работать только с переменным током.

Структура трехфазного трансформатора | by Grace jia

Трехфазные трансформаторы используются для передачи большого количества электроэнергии. Трехфазный трансформатор - это устройство повышения и понижения напряжения для каждой ступени сети энергосистемы. Трехфазный трансформатор имеет две конструкции.

1. Трехфазный трансформатор должен быть подключен к трехфазному режиму.

2. Трехфазный трансформатор, в котором все трехфазные магнитопроводы и обмотки объединены в одну структуру.

Когда первичная и вторичная обмотки трехфазного однофазного трансформатора соединены, они могут использоваться как трехфазные трансформаторы. По сравнению с тремя однофазными блоками, источник питания с трехфазным трансформатором имеет много преимуществ, например, занимаемое пространство очень мало, объем меньше и стоимость ниже. Трехфазные трансформаторы в основном делятся на две категории: трансформаторы с сердечником и трансформаторы с оболочкой.

Трехфазный трансформатор с железным сердечником

Рассмотрим трехфазный однофазный трансформатор с железным сердечником, разнесенный на 120 °.Если на обмотку подается сбалансированное трехфазное синусоидальное напряжение, магнитные потоки φa, φb и φc также будут синусоидальными и сбалансированными. Если три ветви, несущие эти потоки, объединить вместе, общий поток в комбинированных ветвях станет нулевым. Следовательно, эту ножку можно снять, потому что на ней нет флюса. Из этой конструкции непросто взять сердцевину.

Сердечник трехфазного трансформатора обычно состоит из трех ветвей в одной плоскости. Его можно построить с помощью ламинирования стопкой.Каждая ветвь сердечника имеет обмотки низкого и высокого напряжения. Обмотка низкого напряжения более изолирована от стального сердечника, чем обмотка высокого напряжения.

Обмотка низкого напряжения размещается рядом с сердечником с надлежащей изоляцией между сердечником и обмоткой низкого напряжения. Обмотка высокого напряжения размещается на обмотке низкого напряжения с надлежащей изоляцией между обмотками низкого напряжения. Магнитная цепь ветвей a и c больше, чем у ветви b, а структура асимметрична, что приводит к несбалансированному магнитному току.

Трехфазный трансформатор с кожухом

Трехфазный трансформатор с кожухом может быть сформирован путем объединения трех однофазных трансформаторов кожухового типа. Направление намотки центрального блока b противоположно направлениям намотки блоков a и c. Если система сбалансирована с чередованием фаз a-b-c, магнитный поток также будет сбалансирован.

Размер этого комбинированного потока равен размеру каждого компонента. Площадь поперечного сечения комбинированного ярма такая же, как площадь поперечного сечения внешней стойки и площади поперечного сечения верхней и нижней части ярма.Несбалансированная магнитная цепь мало влияет на характеристики трехслойного трансформатора. Обмотки трехфазного трансформатора кожухового типа могут быть соединены треугольником или звездой по мере необходимости.

Приведенная выше информация предоставлена ​​производителем трансформатора .

Устройство и принцип действия 3-х фазного трансформатора

Силовой трансформатор - важное оборудование в электрической системе.Он используется для передачи и распределения электроэнергии для потребления. У вас должна быть машина с достаточно большой мощностью, чтобы удовлетворить потребности в передаче энергии на большие расстояния. Вот почему родился трехфазный трансформатор.

Так что же такое трехфазный трансформатор? И что это за структура? Давайте рассмотрим статью ниже.

Содержание

1. Что такое трехфазный трансформатор?

2. Устройство и принцип действия трехфазного трансформатора

а.Устройство 3-х фазного трансформатора

г. Принцип действия 3-х фазного трансформатора

3. Некоторые типы 3-х фазных трансформаторов

а. Трансформатор трехфазный закрытый

г. Трансформатор трехфазный открытый

г. Сухой трансформатор

4. Прейскурант на трансформаторы трехфазные

1. Что такое трехфазный трансформатор?

Трехфазный трансформатор - это статическое электромагнитное устройство, предназначенное для передачи энергии или передачи переменных электрических сигналов между цепями посредством явления Фарадея электромагнитной индукции .

Трехфазные трансформаторы играют важную роль в системе передачи электроэнергии. Это оборудование в основном используется в промышленных целях для выработки, передачи и распределения электроэнергии. Трехфазные трансформаторы используются и устанавливаются в местах, потребляющих очень большое количество электроэнергии, таких как здания, квартиры, больницы, электростанции и т. Д.

2. Устройство и принцип действия трехфазного трансформатора

а.Устройство трехфазного трансформатора

В состав трехфазного трансформатора входят 3 основных компонента:

  • Стальной сердечник - один из основных компонентов трехфазного трансформатора. Стальной сердечник трехфазного трансформатора имеет три магнитных столба для наматывания провода и магнит для замыкания магнитной цепи. Стальной сердечник машины изготовлен из листов электротехнической стали, с двух сторон покрыт изолирующей краской и собран вместе в цилиндрическую форму.
  • Трехфазная обмотка машины имеет шесть изолированных медных обмоток, намотанных вокруг цилиндра. Обмотка используется для приема и передачи энергии во время работы машины.
  • Кожухи трансформатора
  • также очень важны, помогая защищать и поддерживать срок службы трансформатора. Обычно корпус трехфазного трансформатора изготавливается из пластика, железа, стали и т. Д., В зависимости от конструкции машины и каждого производителя трехфазного трансформатора, они будут иметь разную конструкцию.

Внутри трехфазного трансформатора

б. Принцип работы трехфазного трансформатора

Принцип работы трехфазного трансформатора очень прост, трехфазные трансформаторы будут работать на основе двух физических явлений:

+ Электрический ток течет через генерируемый провод Магнитное поле

+ Изменение магнитного потока в катушке проводника создает индуцированное напряжение
Когда вы поймете принцип работы машины, вы быстро поймете порядок работы и принципы, обеспечивающие эффективную работу трехфазных трансформаторов и правильную мощность устройства.

3. Некоторые типы 3-х фазных трансформаторов

Обычно трансформаторы классифицируются по классам напряжения, используемому сердечнику, компоновке и расположению обмотки. Ниже мы перечисляем наиболее часто используемые трехфазные трансформаторы на рынке сегодня:

  • Трехфазный трансформатор герметичного типа
  • Трансформатор трехфазный открытый
  • Сухой трехфазный трансформатор

а.Трехфазный трансформатор закрытого типа

Трехфазный трансформатор герметичного типа, охлаждаемый расширительными лопатками. Когда температура в VH высока, эти лопасти расширяются; воздух, идущий непосредственно через лопасти, помогает машине охладиться.

Трехфазный трансформатор закрытого типа

б. Трехфазный трансформатор открытого типа

Трехфазный трансформатор открытого типа имеет цикл охлаждения через вспомогательный масляный бак и лопасти вентилятора.Разница между открытым и герметичным типом заключается в дополнительном масляном баке.

Трехфазный трансформатор открытого типа MBT

г. Сухой трансформатор

Сухие трансформаторы, также известные как трансформаторы из литого пластика, представляют собой трансформаторы с катушками, покрытыми эпоксидной смолой. В отличие от обычных трансформаторов, обмотки и магнитопроводы сухого трансформатора находятся под давлением воздуха. Сухие трансформаторы были созданы, чтобы преодолеть недостатки масляных трансформаторов.Сухие трансформаторы используются в особых условиях, таких как сильное загрязнение окружающей среды, влажность воздуха выше 95%, температура окружающей среды до - 25 ºC.

MBT - Сухой 3-х фазный трансформатор

Статьи по теме:

Что такое силовой трансформатор?

Назначение трансформатора

4. Прейскурант на трехфазные трансформаторы

Трехфазный трансформатор - флагманский продукт акционерного общества «MBT Electrical Equipment» (MBT) .Наша компания гордится тем, что является ведущим производителем и поставщиком престижных распределительных трансформаторов во Вьетнаме с более чем 20-летним опытом в области исследований и производства трансформаторов с командой сотрудников. Сотрудники компании обладают высокой квалификацией; рынок высоко оценил современное технологическое оборудование и станки, продукцию и услуги компании.


Обладая четырьмя заводами площадью более 20000 м2, MBT предоставляет полную линейку продукции, включая однофазные трансформаторы, 3-фазные масляные трансформаторы герметичного типа, трансформаторы открытого типа, сухие трансформаторы и т. Д... К настоящему времени количество трансформаторов, которые MBT экспортировала на рынок, достигло более 50 000 единиц. Кроме того, существуют другие продуктовые линейки, такие как распределительные устройства среднего и низкого напряжения, киоски, одноколоночные интегрированные электростанции, стабилизаторы напряжения, реакторы переменного и постоянного тока и т. Д.


С девизом бизнеса: «Качество питает надежность» - обращаясь в MBT, клиенты всегда получат высококачественную продукцию, разумные цены, самые быстрые сроки доставки и лучшее гарантийное обслуживание.

Немедленно свяжитесь с +84913 006 538 или по электронной почте: [адрес электронной почты защищен] для бесплатной консультации и поддержки и получения наиболее выгодного предложения.

Трансформаторные языковые модели белков - это изучающие структуру без учителя

1 Введение

Неконтролируемое моделирование белковых контактов играет важную роль в вычислительном дизайне белков (Russ et al., 2020; Tian et al., 2018; Blazejewski et al., 2019) и является центральным элементом всех современных методов прогнозирования структуры (Wang et al., 2017; Senior et al., 2020; Ян и др., 2019). Стандартный биоинформатический конвейер для неконтролируемого прогнозирования контактов включает в себя несколько компонентов со специализированными инструментами и базами данных, которые разрабатывались и оптимизировались десятилетиями. В этой работе мы предлагаем заменить текущий многоступенчатый конвейер одним прямым проходом предварительно обученной сквозной языковой модели белка. 1

В прошлом году моделирование белкового языка с целью обучения без учителя исследовалось несколькими группами (Rives et al., 2019; Alley et al., 2019; Heinzinger et al., 2019; Рао и др., 2019; Мадани и др., 2020). Давняя практика в биоинформатике заключалась в подгонке линейных моделей к целевым наборам эволюционно связанных и выровненных последовательностей; Напротив, моделирование на языке белков обучает нелинейные глубокие нейронные сети на больших базах данных эволюционно разнообразных и невыровненных последовательностей. Было показано, что модели языка с высокой емкостью белков изучают основные внутренние свойства белков, такие как структура и функция, на основе данных о последовательностях (Rives et al., 2019).

Направление работы в этой развивающейся области предлагает Transformer для моделирования языка белков (Rives et al., 2019; Rao et al., 2019). Изначально разработанная сообществом НЛП для представления долгосрочного контекста, основным нововведением модели Transformer является использование самовнимания (Vaswani et al., 2017). Самовнимание имеет особое значение для моделирования белковых последовательностей. В отличие от сверточных и рекуррентных моделей LSTM, Transformer строит карту попарного взаимодействия между всеми позициями в последовательности.В принципе, этот механизм имеет идеальную форму для моделирования контактов остаток-остаток.

Теоретически сквозное обучение с помощью языковой модели имеет преимущества по сравнению с конвейером биоинформатики: (i) оно заменяет дорогостоящие этапы запроса, согласования и обучения одним прямым проходом, что значительно ускоряет извлечение признаков; и (ii) он имеет общие параметры для всех семейств белков, что делает возможным обобщение за счет улавливания общности миллионов эволюционно разнообразных и неродственных последовательностей.

Мы демонстрируем, что модели белков трансформера изучают контакты в картах самовнимания с современной производительностью. Мы сравниваем ESM-1b (Rives et al., 2020), крупномасштабную (параметры 650M) модель трансформатора, обученную на UniRef50 (Suzek et al., 2007), с конвейером Gremlin (Kamisetty et al., 2013), который реализует логарифмическая линейная модель, обученная с использованием псевдодостоверности (Balakrishnan et al., 2011; Ekeberg et al., 2013). Контакты могут быть извлечены из карт внимания модели Transformer с помощью разреженной линейной комбинации голов внимания, идентифицированных логистической регрессией.Контакты модели ESM-1b имеют более высокую точность, чем контакты Gremlin. Когда ESM и Gremlin сравниваются с доступом к одному и тому же набору последовательностей, выигрыш в точности от модели языка белка является значительным; Преимущество сохраняется в среднем даже тогда, когда Gremlin предоставляется доступ к оптимизированному набору множественных выравниваний последовательностей, включающих данные метагеномики.

Мы находим линейную зависимость между сложностью языкового моделирования и точностью контакта. Мы также находим доказательства ценности совместного использования параметров: модель ESM-1b значительно превосходит Gremlin по протеинам с малой глубиной MSA.Наконец, мы исследуем способность языковой модели Transformer генерировать последовательности и покажем, что сгенерированные последовательности сохраняют контактную информацию.

3 Сопутствующие работы

Существует долгая история предсказания контакта с белками (Adhikari & Cheng, 2016) как с помощью MSA, так и с недавних пор с использованием моделей языка белков.

Предсказание контактов с учителем

Недавно контролируемые методы с использованием глубокого обучения привели к прорывным результатам в прогнозировании контактов с учителем (Wang et al., 2017; Джонс и Кандатил, 2018; Ян и др., 2019; Senior et al., 2020; Адхикари и Элофссон, 2020). Современные методы используют глубокие остаточные сети, обученные под наблюдением многих белковых структур. Входными данными обычно являются ковариационная статистика (Jones & Kandathil, 2018; Adhikari & Elofsson, 2020) или предполагаемые коэволюционные параметры (Wang et al., 2017; Liu et al., 2018; Senior et al., 2020; Yang et al., 2019). Другая недавняя работа с глубоким обучением использует в качестве входных данных последовательности или эволюционные особенности (AlQuraishi, 2018; Ingraham et al., 2019). Xu et al. (2020) демонстрирует, что включение коэволюционных функций имеет решающее значение для выполнения современных современных методов.

Неконтролируемое предсказание контакта

В отличие от контролируемых методов, модели неконтролируемого предсказания контакта обучаются на последовательностях без информации от белковых структур . В принципе, это позволяет им пользоваться преимуществами больших баз данных последовательностей, которые включают информацию из многих последовательностей, для которых отсутствуют структурные знания.Основной подход заключался в изучении эволюционных ограничений среди набора похожих последовательностей путем подгонки марковского случайного поля (модель Поттса) к лежащему в основе MSA, метод, известный как анализ прямой связи (DCA). Это было предложено Lapedes et al. (1999) и повторно введен Thomas et al. (2008) и Weigt et al. (2009).

Для подбора лежащего в основе марковского случайного поля были разработаны различные методы, включая DCA среднего поля (mfDCA) (Morcos et al., 2011), разреженную обратную ковариацию (PSICOV) (Jones et al., 2011) и максимизации псевдоядности (Balakrishnan et al., 2011; Ekeberg et al., 2013; Seemayer et al., 2014). Максимизация псевдодостоверности обычно считается современным для неконтролируемого прогнозирования контактов, а реализация Gremlin (Balakrishnan et al., 2011) используется в качестве основы повсюду. Мы также предоставляем базовые уровни mfDCA и PSICOV. В последнее время методы глубокого обучения также применялись для подбора MSA, и Riesselman et al. (2018) обнаружили доказательства того, что факторы, изученные с помощью модели VAE, могут коррелировать со структурой белка.

Прогнозирование структуры по контактам

Хотя мы не выполняем предсказание структуры в этой работе, было предложено множество методов для расширения предсказания контактов до предсказания структуры. Например, EVFold (Marks et al., 2011) и DCAFold (Sulkowska et al., 2012) предсказывают коэволюционирующие связи с использованием модели Поттса, а затем генерируют трехмерные конформации путем прямого сворачивания исходной конформации с моделированием отжига с использованием предсказанного остатка. -остаточные контакты как ограничения. Аналогичным образом FragFold (Kosciolek & Jones, 2014) и Rosetta (Ovchinnikov et al., 2016) включают ограничения из модели Поттса в конвейер на основе сборки фрагментов. Senior et al. (2019), используйте функции из модели Поттса, подходящей для максимизации псевдовероятности, для прогнозирования попарных расстояний с глубокой остаточной сетью и оптимизации окончательной структуры с помощью Rosetta. Все эти работы строятся непосредственно на конвейере неконтролируемого прогнозирования контактов.

Контактное предсказание на основе языковых моделей белков

С момента появления крупномасштабных языковых моделей для обработки естественного языка (Vaswani et al., 2017; Devlin et al., 2019), существует значительный интерес к разработке аналогичных моделей для белков (Alley et al., 2019; Rives et al., 2019; Heinzinger et al., 2019; Rao et al., 2019; Elnaggar et al. др., 2020).

Rives et al. (2019) были первыми, кто изучил языковые модели белка Transformer, продемонстрировав, что информация о контактах остаток-остаток может быть восстановлена ​​из изученных представлений с помощью линейных проекций, контролируемых структурами белка. Недавно Vig et al.(2020) провели обширный анализ внимания Transformer, выявив соответствия биологически значимым характеристикам, а также обнаружили, что разные уровни модели отвечают за изучение различных функций. В частности, Vig et al. (2020) изучили механизм самовнимания и обнаружили корреляцию между картами самовнимания и паттернами контактов, предположив, что их можно использовать для прогнозирования контактов.

Предыдущая работа по тестированию прогнозирования контактов с помощью моделей языка белков была сосредоточена на контролируемой проблеме.Bepler & Berger (2019) были первыми, кто точно настроил LSTM, предварительно обученный на последовательностях белков, для соответствия контактам. Рао и др. (2019) и Rives et al. (2020) проводят сравнительный анализ нескольких языковых моделей белков с использованием глубокой остаточной сети, соответствующей контролируемому обучению, поверх предварительно обученных функций языкового моделирования.

В отличие от предыдущей работы над моделями языка белков, мы обнаружили, что современный неконтролируемый предсказатель контакта может быть непосредственно извлечен из карт самовнимания Transformer.Мы проводим тщательный анализ предсказателя контактов, показывая взаимосвязь между производительностью и глубиной MSA, а также сложности языкового моделирования. Мы также предлагаем методы для повышения производительности с использованием последовательностей из MSA и для выборки последовательностей таким образом, чтобы сохранить контакты.

4 Модели

Мы сравниваем модели Transformer, обученные на больших базах данных последовательностей, с моделями Potts, обученными на индивидуальных MSA. Хотя модели Трансформеров и Поттса возникли в отдельных исследовательских сообществах, эти две модели имеют общие общие черты (Wang & Cho, 2019), которые мы используем здесь.Наш главный результат состоит в том, что точно так же, как Gremlin напрямую представляет контакты через свою парную составляющую (веса), Трансформатор также напрямую представляет контакты через свою парную составляющую (самовнимание).

4.1 Цели

Для набора обучающих последовательностей, X , Gremlin оптимизирует следующую потерю псевдодостоверности, когда одна позиция маскируется и прогнозируется из ее контекста. Поскольку входы в Gremlin выровнены, все они имеют длину L :

Потери моделирования на языке маскировки (MLM), используемые моделями Transformer, можно рассматривать как обобщение цели модели Поттса, если записать ее следующим образом:

В отличие от Gremlin, цель MLM, применяемая при моделировании языка белков, обучается на невыровненных последовательностях.Ключевым отличием MLM является одновременное маскирование и прогнозирование нескольких позиций, а не маскирование и прогнозирование по одному. Это позволяет масштабировать модель за пределы отдельных MSA до массивных наборов данных последовательности. На практике математическое ожидание под шаблоном маскирования вычисляется стохастически с использованием одной выборки в каждую эпоху.

4.2 Gremlin

Логическая вероятность, оптимизированная Gremlin, описана в разделе A.3. Контакты извлекаются из попарных параметров Гремлина путем взятия нормы Фробениуса по размерам аминокислот, в результате чего получается матрица связи L × L .Поправка на среднее произведение (APC) применяется к этой матрице связи для определения окончательных прогнозов (раздел A.2).

Gremlin принимает MSA в качестве входных данных. Качество прогнозов на выходе сильно зависит от построения MSA. Мы сравниваем с Гремлином при двух условиях. В первом условии мы представляем Gremlin все MSA из обучающего набора trRosetta (Yang et al., 2019). Эти MSA были созданы для всего Uniref100, а также дополнены метагеномными последовательностями, когда глубина от Uniref100 слишком мала.TrRosetta MSA - ключевой ингредиент современного конвейера фолдинга белков. См. Yang et al. (2019) для обсуждения значительного влияния метагеномных последовательностей на конечный результат. Во втором параметре мы разрешаем Gremlin доступ только к той же информации, что и ESM Transformers, генерируя MSA через Jackhmmer на обучающем наборе ESM (подмножество Uniref50). См. Раздел A.5 для получения информации о параметрах Jackhmmer.

4.3 Трансформаторы

Мы оцениваем несколько предварительно обученных моделей трансформаторов, включая ESM-1 (Rives et al., 2019), ProtBert-BFD (Elnaggar et al., 2020) и TAPE Transformer (Rao et al., 2019). Ключевыми различиями между этими моделями являются наборы данных, размеры моделей и гиперпараметры (основные различия в архитектуре описаны в таблице 3). Лю и др. (2019) ранее показали, что эти изменения могут существенно повлиять на производительность окончательной модели. Помимо ESM-1, мы также оцениваем обновленную версию ESM-1b, которая является результатом развертки гиперпараметров. Различия описаны в разделе А.4. Трансформатор обрабатывает входные данные через серию блоков, чередующих уровни самовнимания с несколькими головками и уровни прямой связи. В каждом заголовке уровня самовнимания Transformer рассматривает закодированное представление как набор троек запроса-ключ-значение. Вывод головы - результат масштабированного внимания скалярного произведения:

Вместо того, чтобы вычислять внимание только один раз, подход с несколькими головками запускает масштабированное скалярное произведение внимания несколько раз параллельно и объединяет выходные данные. Поскольку самовнимание явно конструирует парные взаимодействия ( QK T ) между всеми положениями в последовательности, модель может непосредственно представлять взаимодействия остаток-остаток.В этой работе мы демонстрируем, что парные «карты собственного внимания» QK T действительно фиксируют точные контакты.

4.4 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ

Чтобы извлечь контакты из трансформатора, мы сначала пропускаем входную последовательность через модель, чтобы получить карты внимания (одна карта для каждой головы в каждом слое). Затем мы симметризуем и применяем APC к каждой карте внимания независимо. Полученные карты проходят через L 1 -регуляризованную логистическую регрессию, которая применяется независимо к каждой паре аминокислот ( i, j ).Во время обучения мы тренируем только веса логистической регрессии; мы не распространяемся по всей модели. Во время тестирования весь конвейер прогнозирования может быть запущен за один прямой проход, обеспечивая единый сквозной конвейер для прогнозирования контакта с белками, который не требует каких-либо шагов извлечения из базы данных последовательностей. См. Рисунок 1 для иллюстрации этого конвейера и Раздел A.7 для полного описания настройки логистической регрессии.

Рисунок 1:

Конвейер прогнозирования контактов.Трансформатор сначала предварительно обучается на последовательностях из большой базы данных (Uniref50) с помощью моделирования на языке маскировки. После завершения обучения карты внимания извлекаются, проходят симметризацию и корректировку среднего продукта, а затем переходят в регрессию. Регрессия обучается на небольшом количестве ( n ≤ 20) белков, чтобы определить, какие головы внимания являются информативными. Во время тестирования прогнозирование контакта на основе входной последовательности может быть выполнено полностью на графическом процессоре за один прямой проход.

5 Результаты

Мы оцениваем модели с белками 15051 в наборе обучающих данных trRosetta (Yang et al., 2019), удалив 43 белка с длиной последовательности больше 1024, поскольку ESM-1b был обучен с размером контекста 1024. Из этих последовательностей Джекхммер терпит неудачу на 126, когда мы пытаемся построить MSA с использованием обучающего набора ESM (см. Раздел A .5). В итоге у нас осталось 14882 последовательности. Мы оставляем за собой 20 последовательностей для обучения, 20 последовательностей для проверки и 14842 последовательности для тестирования.

В таблице 1 приведены оценки моделей Gremlin, ESM-1, ESM-1b, а также моделей TAPE и ProtBERT-BFD. Доверительные интервалы находятся в пределах 0.5 процентных пунктов для всех статистических данных в таблицах 1 и 2. В таблице 1 все предикторы контактов модели Transformer обучены с помощью логистической регрессии для 20 белков. Мы обнаружили, что всего с 20 обучающими белками ESM-1b имеет более высокую точность, чем Gremlin, для коротких, средних и дальних контактов.

Таблица 1:

Средняя точность 14842 тестовых структур для моделей трансформаторов, обученных на 20 структурах.

Таблица 2:

ESM-1b Абляции с ограниченным контролем и с информацией MSA. n - количество обучающих белков логистической регрессии. s - количество ансамблей последовательностей.

Таблица 3: Основные различия архитектуры

в моделях языка протеинового преобразователя

В дополнение к этому набору мы также оцениваем производительность 15 FM-доменов CASP13 в Разделе A.6. В среднем ESM-1b имеет более высокую точность на коротких, средних и длинных дистанциях, чем Gremlin, по всем показателям и, в частности, может значительно превосходить MSA с низким эффективным числом последовательностей. Мы также проводим сравнение с билинейной моделью, предложенной Ривесом и др.(2020). Модель логистической регрессии достигает точности контакта на большом расстоянии при L, равном 18,6, в то время как полностью контролируемая билинейная модель достигает точности на большом расстоянии при L, равном 20,1, что всего на 1,5 балла, несмотря на то, что обучение проводилось на 700-кратном большем количестве структур.

5.1 Абляции: ограничение надзора

Хотя задача языкового моделирования полностью неконтролируема, логистическая регрессия обучается с помощью небольшого количества контролируемых примеров. В этом разделе мы изучаем зависимость результатов от этого наблюдения, предоставляя доказательства того, что контакты действительно усваиваются в неконтролируемой фазе, а логистическая регрессия необходима только для извлечения контактов.

Top Heads

Здесь мы используем логистическую регрессию только для определения наиболее важных голов. После того, как они выбраны, мы отбрасываем веса из логистической регрессии и просто усредняем головы внимания, соответствующие значениям веса top-k. Взяв единственную лучшую голову из ESM-1b, мы приближаемся к производительности Gremlin при тех же данных, а усреднение пяти лучших голов позволяет нам превзойти Gremlin. Усреднение топ-10 голов превосходит полную логистическую регрессию по всем другим моделям Transformer и приближается к Gremlin с учетом оптимизированных MSA.

Low-N

Второй вариант, который мы рассматриваем, - это ограничение количества контролируемых примеров, предоставляемых логистической регрессией. Мы обнаружили, что с только с одним обучающим примером , модель достигает дальности верхнего L-точности 39,2, что статистически неотличимо от Gremlin (p> 0,05). Используя всего 10 обучающих примеров, модель превосходит Gremlin по всем показателям. Поскольку эти результаты зависят от выбранных обучающих белков, мы также показываем загрузочное распределение производительности с использованием 100 различных моделей логистической регрессии в Разделе A.10. Мы обнаружили, что с 1 белком эффективность может значительно различаться: среднее значение максимальной точности L = 35,6, медиана 38,4 и стандартное отклонение 8,9. Эта вариация значительно уменьшается при тренировке с 20 белками, при этом среднее значение дальности верхнего L составляет 40,1, медиана 41,1 и стандартное отклонение 0,3. См. Рисунок 12 для полного распределения всех статистических данных.

MSA Only

Наконец, мы рассматриваем контроль логистической регрессии только с помощью MSA, а не реальных структур.Это те же данные обучения, которые использовались в базовых показателях Gremlin. Для этого мы сначала обучаем Гремлина на каждом MSA. Мы берем выходные связи от Gremlin и помечаем верхние L-связи с разделением последовательностей ≥ 6 в каждом белке как истинные контакты, а все остальное как ложные контакты, создавая проблему бинарного решения. При обучении на 20 MSA мы обнаружили, что эта модель достигает P @ L на дальних дистанциях, равного 39,9, и в целом обеспечивает такие же характеристики на дальних дистанциях, что и Gremlin, при сохранении превосходной точности контакта на коротких и средних дистанциях.

5.2 Ансамблирование MSA

Модели трансформаторов в основном являются моделями с одной последовательностью, но мы можем дополнительно повысить производительность, объединяя предсказания из нескольких последовательностей при выравнивании. Для этого мы отменяем выравнивание каждой последовательности в выравнивании (удаляя любые пробелы), пропускаем полученную последовательность через преобразователь и регрессию и повторно выравниваем результирующие карты контактов с исходными выровненными индексами. Для этих экспериментов мы используем веса логистической регрессии, обученные на входах с одной последовательностью, а не повторно обучаем логистическую регрессию на входах с несколькими последовательностями.Мы также просто берем первые s последовательностей в MSA. В таблице 2 показаны улучшения производительности при усреднении по 16, 32 и 64 последовательностям.

Чтобы лучше понять этот результат, мы возвращаемся к настройке одиночной последовательности и изучаем изменение предсказания при переключении между последовательностями в выравнивании. Мы обнаружили, что точность контакта может значительно варьироваться в зависимости от точной последовательности, вводимой в модель, и что исходная последовательность запроса MSA не обязательно обеспечивает наивысшую точность контакта (рисунок 9).

Наконец, Alley et al. (2019) представили метод тонкой настройки, при котором предварительно обученная языковая модель дополнительно обучается на MSA интересующей последовательности («evotuning»). Ранее это исследовалось только для прогнозирования функций и для моделей с относительно низкой производительностью. Мы настраиваем полную модель ESM-1b (которая имеет в 50 раз больше параметров, чем UniRep) для 380 семейств последовательностей белков. Мы обнаружили, что после 30 периодов точной настройки P @ L на больших расстояниях увеличивается лишь незначительно, в среднем на 1.6 процентных пунктов (рисунок 16).

5.3 Распределение производительности

Хотя наша модель в среднем лучше, чем Gremlin при обнаружении контактов, распределение производительности по всем последовательностям в наборе данных по-прежнему неоднозначно. ESM-1b неизменно лучше выделяет контакты на короткие и средние расстояния (рис. 7), но лишь немного превосходит Gremlin по контактам на большие расстояния, когда у Gremlin есть доступ к Uniref100 и метагеномным последовательностям. На рисунке 2 показано распределение P @ L на больших расстояниях для ESM-1b по сравнению сГремлин. В целом, ESM-1b имеет более высокий P @ L на 55% последовательностей в тестовой выборке.

Рисунок 2:

Слева: затруднения при проверке языкового моделирования при задержке Uniref50 и точности контакта в ходе предварительного обучения. ESM-1b был обучен с разной маскировкой, поэтому сложности между версиями несопоставимы. Справа: Распределение характеристик P @ L на большом расстоянии для ESM-1b по сравнению с Gremlin. Каждая точка окрашена в журнал количества последовательностей в MSA, используемых для обучения Гремлина.

Кроме того, мы исследуем взаимосвязь между глубиной MSA и точностью для коротких, средних и дальних контактов (рис. 3).Хотя наш конвейер прогнозирования контактов не использует явным образом MSA, все же существует некоторая корреляция между глубиной MSA и производительностью, поскольку глубина MSA является мерой того, сколько связанных последовательностей присутствует в обучающем наборе ESM-1b. Мы снова видим, что ESM-1b стабильно превосходит Gremlin на всех глубинах MSA для коротких и средних последовательностей. Мы также подтверждаем, что ESM-1b превосходит Gremlin в отношении извлечения контактов на большие расстояния для последовательностей с малым MSA (глубина <1000). ESM-1b также превосходит Gremlin в последовательностях с очень большими MSA (глубина> 16000), что согласуется с предыдущими исследованиями, показывающими плато производительности Gremlin для очень больших MSA, и предполагает, что ESM-1b не страдает теми же проблемами (Анищенко и др. al., 2017).

Рисунок 3: Производительность

Gremlin (trRosetta) с разбивкой по глубине MSA. Для сравнения также показаны характеристики ESM-1b для последовательностей в каждом бине.

Рисунок 4:

Веса логистической регрессии, обученные только для контактов в определенных диапазонах: локальные [3, 6), короткие [6, 12), средние [12, 24), длинные [24, ∞).

5.4 Веса логистической регрессии

В разделе 5.1 мы показываем, что выбор только разреженного подмножества головок внимания может дать хорошие результаты для прогнозирования контактов.В целом, упорядоченная логистическая регрессия L 1 определяет, что 102/660 голов позволяют прогнозировать контакты (рис. 6b). Кроме того, мы обучаем отдельным логистическим регрессиям для выявления контактов в разных диапазонах (локальных, коротких, средних и дальних). Эти регрессии идентифицируют перекрывающийся, но не идентичный набор полезных ориентиров. Две головы внимания имеют 10-ку наивысших весов для обнаружения контактов на всех дистанциях. Одна голова внимания очень положительно коррелирует с местными контактами, но сильно отрицательно коррелирует с дальними контактами.Наконец, мы идентифицируем в общей сложности 104 головы внимания, которые коррелируют (положительно или отрицательно) с контактами только в одном из четырех диапазонов, предполагая, что определенные головы внимания специализируются на обнаружении определенных типов контактов.

5.5 Недоумение и точность контакта

На рис. 2 показана взаимосвязь между производительностью задачи моделирования замаскированного языка (затруднение валидации) и предсказанием контакта (Long Range P @ L). Между сложностью проверки и контактной точностью для каждой модели существует линейная зависимость.Более того, при той же сложности 12-уровневая модель ESM-1 достигает того же P @ L дальнего действия, что и 34-слойная модель ESM-1, предполагая, что недоумение является хорошей прокси-задачей для прогнозирования контактов. Модели ESM-1 и ESM-1b обучаются с использованием разных шаблонов маскировки, поэтому их сложности не могут быть напрямую сопоставлены, хотя линейная зависимость четко видна в обоих. ESM-1 и ESM-1b имеют одинаковое количество параметров; ключевое отличие заключается в их гиперпараметрах и архитектуре. Показанные модели сошлись в предварительном обучении с минимальным уменьшением сложности (или увеличением точности контакта) в более поздние эпохи.Это ясно свидетельствует о том, что как масштаб модели, так и гиперпараметры играют важную роль в способности модели узнавать контакты.

5.6 Калибровка, ложные срабатывания и надежность

Одна проблема с большими нейронными сетями заключается в том, что, хотя они могут быть в среднем точными, они также могут давать ложные результаты с высокой степенью уверенности. Мы исследуем эту возможность с нескольких точек зрения. Во-первых, мы обнаруживаем, что вероятности логистической регрессии близки к истинной вероятности контакта (среднеквадратическая ошибка = 0.014) и может использоваться непосредственно как мера уверенности модели (рисунок 11).

Во-вторых, мы анализируем ложные срабатывания, которые предсказывает модель. Мы обнаружили, что они, скорее всего, находятся на манхэттенском расстоянии 1–4 от истинного контакта (рис. 13а). Это говорит о том, что ложные срабатывания могут возникать из-за способа определения контакта (расстояние Cb-Cb в пределах 8 ангстрем) и могут быть отмечены как истинные контакты в соответствии с другим определением (Zheng & Grigoryan, 2017). Кроме того, когда мы исследуем пример, в котором предсказания модели не близки к истинному контакту, мы видим, что рассматриваемый пример является гомодимером, и что модель учитывает межцепочечные взаимодействия (рис. 14а).Хотя они не определяют структуру мономера, они важны для его функции (Анищенко и др., 2017).

В-третьих, мы проверяем устойчивость модели к вставкам, вставляя последовательные аланины в начало, середину или конец 1000 случайно выбранных последовательностей. Мы обнаружили, что ESM-1b может выдерживать до 256 вставок в начале или конце последовательности и до 64 вставок в середине последовательности, прежде чем производительность начнет значительно ухудшаться. Это говорит о том, что ESM-1b обучается надежному неявному выравниванию белковой последовательности.См. Раздел A.12 для получения более подробной информации.

5.7 MSA Generation

Wang & Cho (2019) отмечают, что трансформеры, обученные цели MLM, могут использоваться генеративно. Здесь мы рассматриваем, сохраняют ли поколения от ESM-1b контактную информацию для данного белка. Способность генерировать последовательности, сохраняющие эту информацию, является необходимым условием для генерации биологически активных белков. Мы выполняем эту оценку, беря входной белок, маскируя несколько позиций и повторно прогнозируя их.Этот процесс повторяется 10000 раз, чтобы сгенерировать псевдо-MSA для входной последовательности (см. Алгоритм 1). Мы передаем полученную MSA в Gremlin для прогнозирования контактов. по всем последовательностям из нашего тестового набора эта процедура приводит к P @ L контакта на большом расстоянии 14,5. На рисунке 17 показан один пример, в котором процедура работает хорошо, когда Gremlin на псевдо-MSA имеет P @ L дальнего действия, равное 52,2. Для сравнения, стандартный трубопровод ESM-1b в этом примере достигает точности контакта 76,7.

A Приложение

A.1 Обозначение

На рисунках указана точность контакта в диапазоне от 0,0 до 1,0. В тексте и в таблицах мы указываем точность контакта в процентах в диапазоне от 0 до 100.

A.2 Коррекция среднего продукта (APC)

При прогнозировании контакта с белками APC обычно используется для коррекции фоновые эффекты энтропии и филогении (Dunn et al., 2008). Для матрицы связи L × L F APC определяется как

Где F i , F j и F - это сумма по i -й строке, j -м столбцу и полной матрице соответственно.Мы применяем APC независимо к симметричным картам внимания каждой головы в Transformer. Эти исправленные карты внимания передаются в качестве входных данных для логистической регрессии.

A.3 Подробности реализации Gremlin

Gremlin обучается путем оптимизации псевдодостоверности W и V , которые соответствуют попарным и индивидуальным аминокислотным склонностям. Приближение псевдодородности моделирует условные распределения исходного совместного распределения и может быть записано: при условии, что W ii = 0 для всех i и что W ijab является симметричным как в последовательности ( i, j ), так и в аминокислоте ( a, b ).Кроме того, Gremlin использует параметр регуляризации, который регулируется в зависимости от глубины MSA.

A.4 Детали реализации ESM-1

Исходные модели ESM-1 были описаны в (Rives et al., 2019). ESM-1 обучается на Uniref50, в отличие от модели TAPE, которая обучается на Pfam (Finn et al., 2014), и модели ProtBERT-BFD, которая обучается на Uniref100 и BFD100 (Steinegger et al., 2019). ESM-1b - это новая модель, которая является результатом обширной развертки гиперпараметров, которая была проведена на более мелких 12-слойных моделях.ESM-1b является результатом увеличения этой модели до 33 слоев.

По сравнению с ESM-1, основные изменения в ESM-1b: более высокая скорость обучения; выпадение после встраивания слова; выученные позиционные вложения; норма конечного слоя перед выводом; и связанные вложения слов ввода / вывода. Вес для всех моделей ESM-1 и ESM-1b можно найти на https://github.com/facebookresearch/esm.

A.5 Jackhmmer Details

Мы используем Jackhmmer версии 3.3.1 с порогом битового ядра 27 и 8 итераций для построения MSA из обучающего набора ESM.Сбои в 126 последовательностях, упомянутые в разделе 4.4, являются результатом ошибки сегментации в hmmbuild после нескольких итераций (количество успешных итераций до ошибки сегментации зависит от входной последовательности). Поскольку мы видим этот сбой менее чем для 1% набора данных, мы предпочитаем игнорировать эти последовательности во время оценки.

Кроме того, мы оценили альтернативные MSA, запустив Jackhmmer до достижения Neff 128 (максимум 8 итераций), процедура, описанная Zhang et al.(2020). Это привело к очень похожим, но немного худшим результатам (средний дальний P @ L 29,3 по сравнению с 31,3 при постоянном использовании выходных данных восьмой итерации). Поэтому мы решили сообщать о результатах, используя максимум 8 итераций.

A.6 Результаты по CASP13

В таблице 4 мы приводим результаты по 15 целям бесплатного моделирования CASP13, для которых были опубликованы PDB. Оцениваются следующие конкретные домены: T0950-D1, T0957s2-D1, T0960-D2, T0963-D2, T0968s1-D1, T0968s2-D1, T0969-D1, T0980s1-D1, T0986s2-D1, T09
-D1. Т1000-Д2, Т1021с3-Д1, Т1021с3-Д2, Т1022с1-Д1.ESM-1b может превзойти Gremlin, и простое усреднение 10 лучших голов ESM-1b дает сопоставимые характеристики с Gremlin.

Таблица 4:

Средних показателей по 15 целям CASP13 FM. Все базовые показатели используют MSA, созданные с помощью подхода генерации MSA trRosetta.

Кроме того, мы сравниваем нашу модель логистической регрессии с моделью прогнозирования билинейных контактов, предложенной Rives et al. (2020). Эта модель обучает две отдельные линейные проекции слоя окончательного представления и вычисляет вероятности контакта через внешнее произведение двух проекций плюс член смещения, который генерирует следующую ненормализованную логарифмическую вероятность:

Здесь x - вектор длины последовательности функций в формате.Каждый W i представляет собой матрицу in, где k - гиперпараметр, управляющий размером проекции.

Мы обучаем эту модель как ограниченному надзору ( n = 20), так и полному надзору ( n = 14257). Для настройки ограниченного наблюдения мы используем те же 20 белков, которые использовались для обучения модели разреженной логистической регрессии. Для настройки полного контроля мы генерируем 95/5% случайное разделение на обучение / проверку 15008 белков trRosetta с длиной последовательности ≤ 1024.

Мы выполнили независимый поиск по сетке по скорости обучения, снижению веса и скрытому размеру для двух настроек. Для параметра n = 20 мы обнаружили, что скорость обучения 0,001, снижение веса 10,0 и размер проекции 512 показали наилучшую производительность на проверочном наборе. Для параметра n = 14257 мы обнаружили, что скорость обучения 0,001, снижение веса 0,01 и размер проекции 512 показали наилучшую производительность на проверочном наборе. Все модели были обучены сходимости, чтобы максимизировать P @ L валидации с терпением 10. n = 20 моделей были обучены с размером пакета 20 (т.е. 1 пакет = 1 эпоха), а n = 14257 моделей были обучены с размером пакета 128.

Билинейная модель работает очень плохо при ограниченном контроле настройки, хуже, чем просто взять голову первого уровня внимания. При полном контроле он умеренно превосходит логистическую регрессию для увеличения дальнего P @ L на 1,5 при использовании в 700 раз большего количества данных.

На рисунке 5 мы отображаем результаты по 15 целям FM, окрашенным эффективным количеством последовательностей.ESM-1b показывает более высокую точность в среднем на L и L / 5, а иногда значительно выше для последовательностей с низким Neff. Поскольку обучающие данные ESM-1b были сгенерированы до CASP13, это говорит о том, что ESM-1b может хорошо обобщаться на новые последовательности.

Рисунок 5: Результаты

для 15 FM-доменов CASP13, окрашенных Неффом.

A.7 Детали логистической регрессии

Для модели со слоями M , головками H и входной последовательностью x длиной L , пусть A mh будет контактом L × L карта с h-й головы в m-м слое.Сначала мы симметризуем эту карту и применяем APC, и пусть a mhi j будет весовым коэффициентом связи между положением последовательности i и j в результирующей карте. Затем мы определяем вероятность контакта между позициями i и j согласно логистической регрессии с параметрами β :

Чтобы соответствовать β , пусть будет набором обучающих белков, k будет минимальным разделением последовательностей, а λ будет весом регуляризации. Тогда цель может быть определена следующим образом:

Мы подбираем параметры β с помощью scikit-learn (Pedregosa et al., 2011) и не распространяют градиенты обратно через веса внимания. Всего наша модель изучает MH + 1 параметров, многие из которых равны нулю благодаря регуляризации L 1 .

В нашей обучающей установке есть три гиперпараметра: количество белков в нашем обучающем наборе, параметр регуляризации λ и минимальное разделение последовательностей обучающих контактов k . Мы обнаружили, что производительность значительно улучшается при увеличении количества белков с 1 до 10, но прирост производительности снижается при увеличении с 10 до 20 (рис. 1).С помощью развертки гиперпараметров мы определили, что оптимальное значение λ равно 0,15. Мы обнаружили, что игнорирование локальных контактов (| i - j | <6) также полезно. Следовательно, если не указано иное, все логистические регрессии обучаются с λ = 0,15, k = 6. См. Рисунок 6a для поиска по сетке количества обучающих белков и штрафа за регрессию. Для этого поиска по сетке мы использовали 20 обучающих белков и 20 проверочных белков. На рисунке 6b показаны веса окончательной логистической регрессии, использованной для ESM-1b.

Рисунок 6:

(a) Сетевой поиск по логистической регрессии по количеству обучающих примеров и штрафу за регуляризацию числа. Показанные значения представляют собой большие значения P @ L для проверочного набора из 20 белков. (b) Веса на голову и по слоям логистической регрессии на лучшей модели ESM-1b.

A.7 Распределение производительности

На рисунке 7 показано полное распределение производительности ESM-1b по сравнению с Gremlin. Когда мы предоставляем Gremlin доступ к Uniref100, наряду с метагеномными последовательностями, ESM-1b по-прежнему стабильно превосходит Gremlin при извлечении контактов ближнего и среднего радиуса действия.Для контактов на большие расстояния Gremlin гораздо более сопоставим и имеет более высокую точность контакта в 47% последовательностей. Имея доступ к одному и тому же набору последовательностей, ESM-1b неизменно превосходит Gremlin в обнаружении коротких, средних и дальних контактов. Это говорит о том, что ESM-1b может намного лучше извлекать информацию из того же набора последовательностей, и предполагает, что дальнейшее масштабирование обучающих данных может улучшить ESM-1b еще больше.

Рисунок 7:

Распределение характеристик P @ L для коротких, средних и длинных дистанций ESM-1b в сравнении сГремлин. Каждая точка окрашена в журнал 2 числа последовательностей в MSA.

Этот анализ дополнительно подтверждается на рисунке 8. При таком же наборе последовательностей ESM-1b превосходит Gremlin в среднем по коротким, средним и дальним контактам, независимо от глубины MSA, сгенерированного в результате обучения ESM-1b. набор.

Рисунок 8: Производительность

Gremlin с разбивкой по глубине MSA с использованием MSA ESM (вверху) и trRosetta (внизу). Для сравнения также показаны характеристики ESM-1b для последовательностей в каждом бине.

Кроме того, мы обнаружили, что ESM-1b может предоставлять различные карты контактов для различных последовательностей в MSA (рис. 9). Это невозможно для Гремлин, которая является моделью на уровне семьи. Мы используем это довольно простым способом, чтобы обеспечить умеренное повышение точности контакта ESM-1b (раздел 5.2).

Рисунок 9:

Распределение затруднений при оценке различных последовательностей из одного и того же MSA. Ось x показывает индекс каждой последовательности, отсортированный в возрастающем порядке по расстоянию Хэмминга от последовательности запроса (последовательность запроса всегда имеет индекс 0).Ось ординат показывает P @ L на большом расстоянии. Черная линия показывает производительность Gremlin на этом MSA.

A.9 Вторичная структура

В разделе 5.4 мы показываем, что некоторые головки, которые обнаруживают локальные контакты (которые часто соответствуют вторичной структуре), на самом деле имеют отрицательную корреляцию с контактами дальнего действия. Мы тестируем способность ESM-1b обнаруживать вторичную структуру посредством внимания, обучая отдельную логистическую регрессию на наборе данных Netsurf (Klausen et al., 2019). Как и в случае с логистической регрессией по контактам, мы вычисляем внимание и выполняем симметризацию APC +.Чтобы предсказать вторичную структуру аминокислоты i , мы используем в качестве входных данных муфты a mhij для каждого слоя m , для каждой головки h и для j ∈ [ i - 5 , i + 5], всего 7260 входных функций. Используя всего 100 из 8678 обучающих белков, мы достигаем 79,3% точности предсказания вторичной структуры 3 классов на тестовом наборе CB513 (Cuff & Barton, 1999). На рисунке 10 показана важность каждого уровня для прогнозирования трех классов вторичной структуры.

Рисунок 10:

L2 норма весов для 3-х классного предсказания вторичной структуры слоем трансформатора.

В разных слоях есть пики для всех трех классов, что указывает на то, что определенные головки в этих слоях специализируются на обнаружении определенных классов вторичной структуры.

На рисунке 10 показана важность каждого уровня трансформатора для прогнозирования каждого из трех классов вторичной структуры. Мы видим, что, как и в случае с предсказанием контакта, наиболее важные слои находятся в средних слоях (14-20) и последних слоях (29-33).Некоторые слои сильнее подпадают под определенные классы контактов (например, слой 33 важен для всех классов, но особенно важен для предсказания β-нитей). Это говорит о том, что определенные головки в этих слоях активируются специально для определенных типов вторичной структуры.

A.10 Начальный доверительный интервал с низким N

В разделе 5.1 показаны результаты надзора с низким N для 1, 10 и 20 белков. Поскольку производительность в этом случае зависит от конкретных взятых белков, мы используем бутстреппинг, чтобы определить доверительный интервал для каждой из этих оценок.Используя полный набор для обучения, проверки и тестирования из 14882 белков, мы обучаем 100 моделей логистической регрессии, используя случайную выборку из N белков, для N = 1, 10 и 20. Затем каждая модель оценивается на оставшихся 14882 - N белков. Полное распределение выборок можно увидеть на рисунке 12. Оценки доверительного интервала для точности на больших расстояниях при L с 1, 10 и 20 обучающими белками составляют: 35,6 ± 1,8, 40,6 ± 0,1 и 41,0 ± 0,1 соответственно.

А.11 Калибровка модели и ложные срабатывания

Vig et al. (2020) предположили, что вероятность внимания от трансформатора TAPE была хорошо откалиброванной оценкой вероятности контакта. На рисунке 11 мы исследуем то же самое с логистической регрессией, обученной на моделях ESM-1 и ESM-1b. Отметим, что ESM-1b, помимо того, что в целом более точен, чем Gremlin, также обеспечивает фактические вероятности.

Рисунок 11:

Откалиброванная вероятность реального контакта с учетом прогнозируемой вероятности контакта для всех тестируемых белков.

Рисунок 12:

Распределение точности для всех представленных статистических данных с использованием 100 различных моделей логистической регрессии. Каждая регрессионная модель обучается на случайной выборке из N = 1, 10, 20 белков.

Мы обнаружили, что, как и в случае с точностью модели, калибровка модели увеличивается с увеличением масштаба и лучшими гиперпараметрами. 6-, 12- и 34-слойные модели ESM-1 имеют среднеквадратичную ошибку 0,074, 0,028 и 0,020 между прогнозируемой и фактической вероятностями контакта, соответственно. ESM-1b имеет среднеквадратичную ошибку 0.014. Среднеквадратичная ошибка вычисляется между вероятностями контакта, разделенными на 20 интервалов в соответствии с функцией scikit-learn Calibration_curve. Поэтому разумно использовать вероятность логистической регрессии в качестве меры уверенности модели.

В случае ложноположительных контактов мы пытаемся измерить манхэттенское расстояние между координатами предполагаемых контактов и ближайшего истинного контакта (рис. 13a). Мы наблюдаем, что манхэттенское расстояние между координатами ложноположительных контактов часто очень близко (Манхэттенское расстояние от 1 до 4) к реальным контактам, и что очень немногие ложные срабатывания имеют манхэттенское расстояние ≥ 10 от истинного контакта.При пороговой вероятности контакта 0,5 83,8% белков имеют по крайней мере один прогнозируемый контакт с манхэттенским расстоянием> 4 до ближайшего контакта. Этот показатель снижается до 71,7% с пороговой вероятностью 0,7 и до 52,5% с пороговой вероятностью 0,9.

Рис. 13:

(a) Распределение манхэттенского расстояния между координатами предсказанных контактов и ближайшего истинного контакта при различных порогах минимума p ( контакт ). Нулевое расстояние соответствует истинному контакту.(b) Фактическое количество прогнозов по манхэттенскому расстоянию по всему набору данных (обратите внимание на ось Y в логарифмической шкале).

На рисунке 14 показаны два режима для ESM-1b, в которых прогнозируется значительное количество ложных контактов. На рис. 14а показан один пример, в котором модель действительно проявляет галлюцинации контактов вокруг остатков 215 и 415, которые не отображаются на карте контактов для этого белка. Однако этот белок является гомодимером, и эти контакты присутствуют на карте межцепочечных контактов. Это говорит о том, что некоторые «крайне неверные» ложные срабатывания могут вместо этого улавливать межцепочечные контакты.На рисунке 14b показан пример повторяющегося белка, для которого методы эволюционного связывания, как известно, улавливают дополнительные «полосы» контактов (Espada et al., 2015; Anishchenko et al., 2017). На карте контактов Gremlin видны несколько полос, в то время как на карте контактов ESM-1b видна только первая полоса, ближайшая к диагонали. Для определения частоты этих режимов, наряду с дополнительными потенциальными модами, потребуется дополнительный анализ.

Рисунок 14:

Иллюстрация двух режимов для ESM-1b, в которых прогнозируется значительное количество ложных контактов.(а) Предполагаемые контакты, которые действительно происходят в полном гомодимерном комплексе, но не присутствуют в виде внутрицепочечных контактов. (б) Белковые контакты CTCF. ESM-1b предсказывает небольшую полосу контактов возле недиагональных остатков с 30 остатками. Эта полоса, наряду с другими подобными полосами, также предсказана Гремлином.

Рисунок 15:

Устойчивость моделей ESM-1b и TAPE к вставкам аланина в начале, середине и конце последовательности

A.12 Выравнивание

Одна гипотеза о преимуществах больших языковых моделей по сравнению с более простыми моделями Поттса моделей заключается в том, что они могут научиться неявному выравниванию благодаря своему усвоенному позиционному встраиванию.Для модели Поттса выравнивание позволяет модели соотносить положения в последовательности с учетом эволюционного контекста, несмотря на наличие вставок или делеций. Мы проверяем устойчивость модели к вставкам, вставляя последовательные аланины в начало, середину или конец 1000 случайно выбранных последовательностей с начальной длиной последовательности <512 (мы ограничиваем исходную длину последовательности, чтобы избежать проблем с нехваткой памяти после вставки. ). Мы обнаружили, что ESM-1b может выдерживать до 256 вставок в начале или конце последовательности и до 64 вставок в середине последовательности, прежде чем производительность начнет значительно ухудшаться.Это говорит о том, что ESM-1b обучается надежному неявному выравниванию белковой последовательности.

С другой стороны, мы обнаружили, что трансформатор TAPE менее устойчив к вставкам. В одной последовательности (pdbid: 1a27) мы обнаружили, что точность TAPE Transformer падает на 12 процентных пунктов после добавления всего 8 аланинов в начало последовательности, в то время как ESM-1b показывает минимальную деградацию до тех пор, пока не будет вставлено 256 аланинов. Мы предполагаем, что, поскольку TAPE был обучен на доменах белка, он не научился справляться с ошибками выравнивания во входной последовательности.

A.13 Подробности эволюционной точной настройки

Мы настроили каждую модель, используя скорость обучения 1e-4, 16k обновлений разминки, график скорости обучения с обратным квадратным корнем и максимум 30 эпох. Это привело к разному количеству общих обновлений в зависимости от размера MSA, при этом более крупным MSA разрешалось обучать для большего количества обновлений. В идеале это должно помочь предотвратить слишком быстрое переоснащение модели на очень маленьких MSA. Мы используем переменный размер партии, основанный на длине входных белков, фиксируя максимум 16384 токена на партию (таким образом, для белка длиной 300 это будет соответствовать размеру партии 54).Мы используем MSA от trRosetta для точной настройки всех белков, за исключением avGFP, где мы используем тот же набор последовательностей от Alley et al. (2019).

A.14 Создание MSA

Алгоритм 1:

Быстро сгенерировать псевдо-MSA из входной последовательности.

Алгоритм 1 представляет алгоритм, используемый для генерации псевдо-MSA из ESM-1b. Каждый псевдо-MSA передается в GREMLIN, чтобы оценить сохранность контактной информации (рисунок 17).

Рисунок 16:

Слева: среднее изменение точности контакта по сравнению сколичество эпох тонкой настройки более 380 белков. Справа: реальные и прогнозируемые контакты до и после эволюционной тонкой настройки для 1a3a и avGFP. Для 1a3a дальний P @ L улучшается с 54,5 до 61,4. Для avGFP P @ L на больших расстояниях улучшается с 7,9 до 11,4.

Рисунок 17:

Контакты для 3qhp от Gremlin, обученные на псевдо-MSA, сгенерированном ESM-1b, по сравнению с реальными и предсказанными контактами ESM-1b. Сгенерированный MSA достигает дальнего P @ L 52,2, в то время как карты внимания достигают точности 76,7.

▷ Что такое трансформатор?

Вот статья Насира, одного из членов сообщества. Если вы также хотите отправить статью, отправьте нам письмо .

Трансформатор - это устройство, которое передает электрический ток из одной цепи в другую, обычно по принципу взаимной индукции. Во время этого процесса частота остается постоянной, а напряжение можно увеличивать или уменьшать в зависимости от необходимости.

Эта передача электричества происходит с помощью двух катушек.Одна из них, известная как первичная катушка, подключена к источнику переменного тока. Другой известен как вторичная катушка, и он подключен к внешней цепи. Это составляет базовую структуру трансформатора и показано ниже:


Принцип работы трансформатора
Трансформатор

работает по принципу закона взаимной индукции Фарадея. Этот принцип гласит, что скорость изменения потока прямо пропорциональна индуцированному электромагнитному потоку.

Точно так же в трансформаторе, когда переменный ток течет через одну из катушек, он создает вокруг нее магнитное поле, которое постоянно создает изменяющийся магнитный поток, и поэтому, когда другая катушка приближается к ней, часть ЭДС также уменьшается. индуцируется и во вторичной катушке. Поскольку вторичная обмотка образует замкнутый контур, ЭДС также производит в ней ток.

Короче говоря, эта взаимная индукция между катушками отвечает за передачу электроэнергии.


Эти обмотки обычно изготавливаются на железном сердечнике, чтобы усилить магнитное поле, а затем ламинируются, чтобы поток не ослабевал из-за воздуха, который является идеальным изолятором. Но все же наблюдаются некоторые потери мощности, такие как потери на вихревые токи и потери на гистерезис.

Типы трансформаторов

Классифицируемые по возрастанию напряжения, мы в первую очередь классифицируем трансформаторы на две основные категории:

    1) Повышающий трансформатор
    2) Понижающий трансформатор

Если мы увеличим количество витков во вторичной катушке, так что они станут больше, чем количество витков в первичной обмотке, индуцированное напряжение может быть увеличено в прямом связь.то есть, если количество витков вторичной обмотки в десять раз превышает количество витков первичной обмотки, то индуцированное напряжение также будет в десять раз больше, чем в первичной обмотке.

Точно так же, если количество витков в первичной катушке больше, чем количество витков во вторичной катушке, индуцированное напряжение будет меньше исходного напряжения.

Это свойство трансформатора действительно полезно при передаче электроэнергии, особенно на большие расстояния. Чтобы избежать потерь мощности, сначала используется понижающий трансформатор, а на приемном конце используется повышающий трансформатор, который повышает напряжение до необходимого уровня.Такие типы трансформаторов известны как однофазные, двухобмоточные трансформаторы напряжения.

Но также могут быть созданы двухфазные, трехфазные или более высокие трансформаторы, особенно для коммерческих и промышленных целей, где нагрузка достаточно велика, в основном используются три фазы. Подключения трансформатора в 3 фазе показаны ниже:


Как видно из рисунка, трехфазный трансформатор будет иметь три первичные обмотки и три вторичные обмотки. Способ, которым три обмотки соединяются друг с другом, может быть соединением треугольником или соединением Y.Оба они показаны ниже:


Если катушки соединены последовательно, образуя замкнутый контур, то соединение известно как соединение треугольником, но если три обмотки соединены так, что все они имеют общую точку, то образуется соединение Y-типа. Он имеет нейтральный провод в общей конечной точке. Обе эти связи эквивалентны и взаимообразуемы из одной формы в другую.

В следующей части этого урока мы рассмотрим конструкцию трансформатора, который, я думаю, очень важен для инженера-электрика.Я объясню основы конструкции трансформатора, такие как обмотки и т. Д., И проверю, как спроектировать трансформатор.

Так что следите за обновлениями и подпишитесь на нашу рассылку по электронной почте, чтобы получить эти удивительные обучающие программы в свой почтовый ящик. Заботиться.

The Illustrated Transformer - Джей Аламмар - Визуализация машинного обучения по одной концепции за раз.

Обсуждения: Hacker News (65 баллов, 4 комментария), Reddit r / MachineLearning (29 баллов, 3 комментария)
Переводы: Испанский, Китайский (упрощенный), Корейский, Русский, Французский, Японский
Смотреть: лекция MIT по теме «Глубокое обучение» со ссылкой на эту публикацию

В предыдущем посте мы рассмотрели «Внимание» - повсеместный метод в современных моделях глубокого обучения.Внимание - это концепция, которая помогла повысить производительность приложений нейронного машинного перевода. В этом посте мы рассмотрим модель The Transformer , которая привлекает внимание для повышения скорости обучения этих моделей. Трансформеры превосходят модель нейронного машинного перевода Google в определенных задачах. Однако самое большое преимущество заключается в том, что The Transformer поддается распараллеливанию. Фактически, Google Cloud рекомендует использовать The Transformer в качестве эталонной модели для использования своего предложения Cloud TPU.Итак, давайте попробуем разбить модель на части и посмотрим, как она работает.

Трансформатор был предложен в статье "Внимание - это все, что вам нужно". Его реализация в TensorFlow доступна как часть пакета Tensor2Tensor. Группа НЛП из Гарварда создала руководство с аннотациями к статье с использованием PyTorch. В этом посте мы попытаемся немного упростить вещи и представить концепции одну за другой, чтобы, надеюсь, облегчить понимание людям без глубоких знаний предмета.

Обновление 2020 г. : Я создал видео «Рассказанный трансформер», в котором более мягкий подход к теме:

Взгляд высокого уровня

Давайте начнем с рассмотрения модели как единого черного ящика. В приложении машинного перевода оно берет предложение на одном языке и выводит его перевод на другом.

Открывая это совершенство Оптимуса Прайма, мы видим компонент кодирования, компонент декодирования и связи между ними.

Компонент кодирования представляет собой стек кодировщиков (на бумаге шесть из них складываются друг на друга - в цифре шесть нет ничего волшебного, можно определенно поэкспериментировать с другими компоновками). Компонент декодирования представляет собой стек декодеров с одинаковым числом.

Все кодировщики идентичны по структуре (но у них нет общих весов). Каждый из них разбит на два подслоя:

Входные данные кодировщика сначала проходят через слой самовнимания - слой, который помогает кодировщику смотреть на другие слова во входном предложении, когда он кодирует определенное слово.Позже в этой статье мы подробнее рассмотрим самовнимание.

Выходные данные слоя самовнимания передаются в нейронную сеть с прямой связью. Точно такая же сеть прямой связи независимо применяется к каждой позиции.

В декодере есть оба этих уровня, но между ними есть уровень внимания, который помогает декодеру сосредоточиться на соответствующих частях входного предложения (аналогично тому, что делает внимание в моделях seq2seq).

Использование тензоров в картине

Теперь, когда мы увидели основные компоненты модели, давайте начнем смотреть на различные векторы / тензоры и то, как они перемещаются между этими компонентами, чтобы превратить входные данные обученной модели в выходные данные.

Как и в случае с приложениями НЛП в целом, мы начинаем с превращения каждого входного слова в вектор с помощью алгоритма встраивания.


Каждое слово вложено в вектор размером 512. Мы представим эти векторы этими простыми прямоугольниками.

Встраивание происходит только в самый нижний кодировщик. Абстракция, которая является общей для всех кодировщиков, заключается в том, что они получают список векторов, каждый из которых имеет размер 512. В нижнем кодировщике это будет слово embeddings, но в других кодировщиках это будет выход кодировщика, который находится непосредственно под .Размер этого списка - это гиперпараметр, который мы можем установить - в основном это будет длина самого длинного предложения в нашем наборе обучающих данных.

После встраивания слов в нашу входную последовательность каждое из них проходит через каждый из двух уровней кодировщика.


Здесь мы начинаем видеть одно ключевое свойство преобразователя, которое заключается в том, что слово в каждой позиции проходит по своему собственному пути в кодировщике. Между этими путями на уровне самовнимания есть зависимости.Однако слой прямой связи не имеет этих зависимостей, и, таким образом, различные пути могут выполняться параллельно при прохождении через слой прямой связи.

Затем мы заменим пример более коротким предложением и посмотрим, что происходит на каждом подуровне кодировщика.

Теперь мы кодируем!

Как мы уже упоминали, кодировщик получает в качестве входных данных список векторов. Он обрабатывает этот список, передавая эти векторы в слой «самовнимания», затем в нейронную сеть с прямой связью, а затем отправляет выходные данные вверх следующему кодировщику.


Слово в каждой позиции проходит процесс самовнимания. Затем каждый из них проходит через нейронную сеть с прямой связью - точно такую ​​же сеть, и каждый вектор проходит через нее отдельно.

Самовнимание на высоком уровне

Не обманывайтесь, когда я использую слово «самовнимание», как будто это понятие должно быть знакомо каждому. Я лично никогда не сталкивался с этой концепцией, пока не прочитал статью «Все, что вам нужно». Давайте разберемся, как это работает.

Скажем, следующее предложение является вводным предложением, которое мы хотим перевести:

Животное не переходило улицу, потому что оно слишком устало

Что означает «оно» в этом предложении? Относится ли это к улице или к животному? Это простой вопрос для человека, но не такой простой для алгоритма.

Когда модель обрабатывает слово «оно», самовнимание позволяет ей ассоциировать «это» с «животным».

По мере того, как модель обрабатывает каждое слово (каждую позицию во входной последовательности), самовнимание позволяет ей смотреть на другие позиции во входной последовательности в поисках подсказок, которые могут помочь улучшить кодирование этого слова.

Если вы знакомы с RNN, подумайте, как поддержание скрытого состояния позволяет RNN включать свое представление предыдущих слов / векторов, которые она обработала, с текущим, обрабатываемым ею. Самовнимание - это метод, который Трансформер использует для «запекания» других релевантных слов в словах, которые мы обрабатываем в данный момент.


Поскольку мы кодируем слово «оно» в кодировщике №5 (верхний кодировщик в стеке), часть механизма внимания фокусировалась на «Животном» и запекла часть его представления в кодировке «оно».

Обязательно ознакомьтесь с записной книжкой Tensor2Tensor, где вы можете загрузить модель Transformer и изучить ее с помощью этой интерактивной визуализации.

Самостоятельное внимание в деталях

Давайте сначала посмотрим, как вычислить самовнимание с помощью векторов, а затем перейдем к рассмотрению того, как это на самом деле реализовано - с помощью матриц.

Первый шаг при вычислении самовнимания состоит в том, чтобы создать три вектора из каждого из входных векторов кодировщика (в данном случае - вложение каждого слова).Итак, для каждого слова мы создаем вектор запроса, вектор ключа и вектор значения. Эти векторы создаются путем умножения вложения на три матрицы, которые мы обучили в процессе обучения.

Обратите внимание, что эти новые векторы меньше по размерности, чем вектор внедрения. Их размерность составляет 64, в то время как векторы ввода / вывода встраивания и кодировщика имеют размерность 512. Они НЕ ДОЛЖНЫ быть меньше, это выбор архитектуры, позволяющий сделать вычисление многогранного внимания (в основном) постоянным.


Умножение x1 на весовую матрицу WQ дает q1, вектор "запроса", связанный с этим словом. В итоге мы создаем проекцию «запроса», «ключа» и «значения» для каждого слова во входном предложении.

Что такое векторы «запроса», «ключа» и «значения»?

Это абстракции, которые полезны для вычисления внимания и размышлений о нем. Когда вы перейдете к чтению того, как рассчитывается внимание ниже, вы будете знать почти все, что вам нужно знать о роли каждого из этих векторов.

Второй этап в вычислении самовнимания - это подсчет баллов. Предположим, мы рассчитываем самовнимание для первого слова в этом примере - «Мышление». Нам нужно сопоставить каждое слово входного предложения с этим словом. Оценка определяет, сколько внимания следует уделять другим частям входного предложения, когда мы кодируем слово в определенной позиции.

Оценка рассчитывается как скалярное произведение вектора запроса на ключевой вектор соответствующего слова, которое мы оцениваем.Итак, если мы обрабатываем самовнимание для слова в позиции №1, первая оценка будет скалярным произведением q1 и k1. Вторая оценка будет скалярным произведением q1 и k2.


Третий и четвертый этапы заключаются в разделении оценок на 8 (квадратный корень из размерности ключевых векторов, используемых в статье - 64. Это приводит к получению более стабильных градиентов. Здесь могут быть другие возможные значения, но это значение по умолчанию), затем передайте результат через операцию softmax.Softmax нормализует оценки, так что все они положительные и в сумме составляют 1.


Эта оценка softmax определяет, насколько каждое слово будет выражено в этой позиции. Очевидно, что слово в этой позиции будет иметь самый высокий балл softmax, но иногда полезно обратить внимание на другое слово, имеющее отношение к текущему слову.

Пятый этап заключается в умножении каждого вектора значений на показатель softmax (при подготовке к их суммированию). Интуиция здесь заключается в том, чтобы сохранить неизменными значения слов, на которых мы хотим сосредоточиться, и заглушить не относящиеся к делу слова (умножив их на крошечные числа, такие как 0.001, например).

Шестой этап предназначен для суммирования векторов взвешенных значений. Это производит вывод слоя самовнимания в этой позиции (для первого слова).


На этом расчет самовнимания завершен. Результирующий вектор - это тот, который мы можем отправить в нейронную сеть с прямой связью. Однако в реальной реализации этот расчет выполняется в матричной форме для более быстрой обработки. Итак, давайте посмотрим на это теперь, когда мы увидели интуитивное вычисление на уровне слов.

Матрица расчета самовнимания

Первый шаг - вычислить матрицы запроса, ключа и значения. Мы делаем это, упаковывая наши вложения в матрицу X и умножая ее на матрицы весов, которые мы обучили (WQ, WK, WV).


Каждая строка в матрице X соответствует слову во входном предложении. Мы снова видим разницу в размере вектора встраивания (512 или 4 прямоугольника на рисунке) и векторов q / k / v (64 или 3 прямоугольника на рисунке).

Наконец, , поскольку мы имеем дело с матрицами, мы можем сжать шаги со второго по шестой в одной формуле для вычисления результатов слоя самовнимания.


Расчет самовнимания в матричной форме

Многоголовый зверь

В статье дополнительно усовершенствован слой самовнимания, добавлен механизм, называемый «многоглавым» вниманием. Это улучшает производительность слоя внимания двумя способами:

  1. Расширяет способность модели фокусироваться на разных позициях. Да, в приведенном выше примере z1 содержит немного любой другой кодировки, но в ней может преобладать само слово.Было бы полезно, если бы мы переводили предложение вроде «Животное не перешло улицу, потому что оно слишком устало», мы хотели бы знать, к какому слову «оно» относится.

  2. Он дает слою внимания несколько «подпространств представления». Как мы увидим далее, с многоголовым вниманием у нас есть не только один, но и несколько наборов весовых матриц запроса / ключа / значения (преобразователь использует восемь головок внимания, поэтому мы получаем восемь наборов для каждого кодировщика / декодера). . Каждый из этих наборов инициализируется случайным образом.Затем, после обучения, каждый набор используется для проецирования входных вложений (или векторов из нижних кодеров / декодеров) в другое подпространство представления.


С многоголовым вниманием мы поддерживаем отдельные весовые матрицы Q / K / V для каждой головы, в результате чего получаются разные матрицы Q / K / V. Как и раньше, мы умножаем X на матрицы WQ / WK / WV, чтобы получить матрицы Q / K / V.


Если мы выполним тот же расчет самовнимания, который мы описали выше, всего восемь раз с разными весовыми матрицами, мы получим восемь разных Z-матриц


Это оставляет нам небольшую проблему.Слой прямой связи не ожидает восьми матриц - он ожидает единственную матрицу (вектор для каждого слова). Итак, нам нужен способ сжать эти восемь элементов в единую матрицу.

Как мы это делаем? Мы объединяем матрицы, а затем умножаем их на дополнительную матрицу весов WO.


Вот и все, что нужно для многоглавого самовнимания. Я понимаю, что это довольно много матриц. Позвольте мне попытаться объединить их все в один визуал, чтобы мы могли рассматривать их в одном месте


Теперь, когда мы коснулись головок внимания, давайте вернемся к нашему предыдущему примеру, чтобы увидеть, где фокусируются различные головы внимания, когда мы кодируем слово «оно» в нашем примере предложения:


Когда мы кодируем слово «оно», одна голова внимания больше всего сосредотачивается на «животном», а другая - на «усталом» - в некотором смысле, представление модели слова «оно» вписывается в некоторые из представлений как "животное", так и "уставшее".

Однако, если мы добавим к изображению все внимание, интерпретировать вещи будет сложнее:


Представление порядка последовательности с использованием позиционного кодирования

В модели, которую мы описали до сих пор, отсутствует одна вещь, так это способ учесть порядок слов во входной последовательности.

Чтобы решить эту проблему, преобразователь добавляет вектор к каждому встраиванию входа. Эти векторы следуют определенному шаблону, который модель изучает, что помогает ей определять положение каждого слова или расстояние между разными словами в последовательности.Интуиция здесь заключается в том, что добавление этих значений к вложениям обеспечивает значимые расстояния между векторами встраивания, когда они проецируются в векторы Q / K / V и во время внимания скалярного произведения.


Чтобы дать модели ощущение порядка слов, мы добавляем векторы позиционного кодирования, значения которых следуют определенному шаблону.

Если мы предположим, что вложение имеет размерность 4, фактическое позиционное кодирование будет выглядеть так:


Реальный пример позиционного кодирования с размером вложения игрушки 4

Как может выглядеть этот узор?

На следующем рисунке каждая строка соответствует позиционному кодированию вектора.Таким образом, первая строка будет вектором, который мы добавим к встраиванию первого слова во входной последовательности. Каждая строка содержит 512 значений - каждое от 1 до -1. Мы присвоили им цветовую кодировку, чтобы узор был виден.


Реальный пример позиционного кодирования для 20 слов (строк) с размером встраивания 512 (столбцов). Вы можете видеть, что он разделен пополам по центру. Это потому, что значения левой половины генерируются одной функцией (которая использует синус), а правая половина генерируется другой функцией (которая использует косинус).Затем они объединяются, чтобы сформировать каждый из векторов позиционного кодирования.

Формула позиционного кодирования описана в документе (раздел 3.5). Вы можете увидеть код для генерации позиционных кодировок в get_timing_signal_1d () . Это не единственный возможный метод позиционного кодирования. Однако это дает преимущество возможности масштабирования до невидимой длины последовательностей (например, если нашу обученную модель просят перевести предложение длиннее, чем любое из предложений в нашем обучающем наборе).

Обновление за июль 2020 года: Позиционное кодирование, показанное выше, взято из реализации Transformer2Transformer. Метод, показанный в статье, немного отличается тем, что он не соединяет напрямую, а переплетает два сигнала. На следующем рисунке показано, как это выглядит. Вот код для его создания:


Остатки

Одна деталь в архитектуре кодера, которую мы должны упомянуть, прежде чем двигаться дальше, заключается в том, что каждый подуровень (самовнимание, ffnn) в каждом кодере имеет остаточное соединение вокруг себя, за которым следует этап нормализации уровня. .


Если мы визуализируем векторы и операцию уровня-нормы, связанную с самовниманием, это будет выглядеть так:


Это также относится к подуровням декодера. Если мы представим себе преобразователь из двух стековых кодировщиков и декодеров, он будет выглядеть примерно так:


Сторона декодера

Теперь, когда мы рассмотрели большинство концепций кодировщика, мы в основном знаем, как работают компоненты декодеров.Но давайте посмотрим, как они работают вместе.

Кодер запускает обработку входной последовательности. Затем выходной сигнал верхнего кодера преобразуется в набор векторов внимания K и V. Они должны использоваться каждым декодером на его уровне «внимание кодер-декодер», который помогает декодеру сосредоточиться на соответствующих местах во входной последовательности:


После завершения этапа кодирования мы начинаем этап декодирования. Каждый шаг в фазе декодирования выводит элемент из выходной последовательности (в данном случае предложение английского перевода).

Следующие шаги повторяют процесс до тех пор, пока не будет достигнут специальный символ, указывающий, что декодер трансформатора завершил свой вывод. Выходной сигнал каждого шага подается в нижний декодер на следующем временном шаге, и декодеры выводят свои результаты декодирования так же, как это сделали кодеры. И так же, как мы поступили с входами кодировщика, мы встраиваем и добавляем позиционное кодирование к этим входам декодера, чтобы указать положение каждого слова.


Слои самовнимания в декодере работают немного иначе, чем в кодере:

В декодере слой самовнимания может обращать внимание только на более ранние позиции в выходной последовательности.Это делается путем маскирования будущих позиций (установка их на -inf ) перед шагом softmax в вычислении самовнимания.

Слой «Внимание кодировщика-декодера» работает так же, как многоголовое самовнимание, за исключением того, что он создает свою матрицу запросов из нижележащего уровня и берет матрицу ключей и значений из выходных данных стека кодировщика.

Последний слой Linear и Softmax

Стек декодера выводит вектор чисел с плавающей запятой. Как превратить это в слово? Это работа последнего слоя Linear, за которым следует слой Softmax.

Линейный слой - это простая полносвязная нейронная сеть, которая проецирует вектор, созданный стеком декодеров, в гораздо более крупный вектор, называемый вектором логитов.

Предположим, что наша модель знает 10 000 уникальных английских слов («выходной словарь» нашей модели), которые она выучила из набора обучающих данных. Это сделало бы вектор логитов шириной 10 000 ячеек - каждая ячейка соответствует количеству уникального слова. Вот как мы интерпретируем вывод модели, за которой следует линейный слой.

Затем слой softmax превращает эти оценки в вероятности (все положительные, все в сумме дают 1,0). Выбирается ячейка с наибольшей вероятностью, и слово, связанное с ней, создается в качестве выходных данных для этого временного шага.


Этот рисунок начинается снизу с вектора, полученного на выходе стека декодера. Затем оно превращается в выходное слово.

Итоги обучения

Теперь, когда мы рассмотрели весь процесс прямого прохода через обученный преобразователь, было бы полезно взглянуть на интуицию обучения модели.

Во время обучения неподготовленная модель должна пройти точно такой же прямой проход. Но поскольку мы обучаем его на помеченном наборе обучающих данных, мы можем сравнить его выходные данные с фактическими правильными выходными данными.

Чтобы наглядно это представить, предположим, что наш выходной словарь содержит только шесть слов («а», «я», «я», «спасибо», «ученик» и «» (сокращение от «конец предложения») ).


Выходной словарь нашей модели создается на этапе предварительной обработки еще до того, как мы начинаем обучение.

Как только мы определим наш выходной словарь, мы можем использовать вектор той же ширины для обозначения каждого слова в нашем словаре. Это также называется горячим кодированием. Так, например, мы можем обозначить слово «am» с помощью следующего вектора:


Пример: быстрое кодирование нашего выходного словаря

После этого резюме давайте обсудим функцию потерь модели - метрику, которую мы оптимизируем на этапе обучения, чтобы создать обученную и, надеюсь, удивительно точную модель.

Функция потерь

Допустим, мы обучаем нашу модель. Допустим, это наш первый шаг на этапе обучения, и мы обучаем его на простом примере - переводе слова «мерси» в «спасибо».

Это означает, что мы хотим, чтобы на выходе было распределение вероятностей, указывающее на слово «спасибо». Но поскольку эта модель еще не обучена, это вряд ли произойдет.


Поскольку все параметры модели (веса) инициализируются случайным образом, (необученная) модель создает распределение вероятностей с произвольными значениями для каждой ячейки / слова.Мы можем сравнить его с фактическим результатом, а затем настроить все веса модели с помощью обратного распространения ошибки, чтобы приблизить результат к желаемому.

Как сравнить два распределения вероятностей? Мы просто вычитаем одно из другого. Для получения дополнительных сведений см. Кросс-энтропию и расхождение Кульбака – Лейблера.

Но учтите, что это упрощенный пример. Более реалистично, мы будем использовать предложение длиннее одного слова. Например - ввод: «je suis étudiant» и ожидаемый результат: «я студент».На самом деле это означает, что мы хотим, чтобы наша модель последовательно выводила распределения вероятностей, где:

  • Каждое распределение вероятностей представлено вектором ширины vocab_size (6 в нашем игрушечном примере, но более реалистично число вроде 30 000 или 50 000)
  • Первое распределение вероятностей имеет самую высокую вероятность в ячейке, связанной со словом «i»
  • Второе распределение вероятностей имеет самую высокую вероятность в ячейке, связанной со словом «am»
  • И так далее, пока пятое выходное распределение не укажет символ « <конец предложения> », с которым также связана ячейка из словаря из 10 000 элементов.

Целевые распределения вероятностей, с которыми мы будем обучать нашу модель в обучающем примере для одного предложения-образца.

После обучения модели в течение достаточного времени на достаточно большом наборе данных мы надеемся, что полученные распределения вероятностей будут выглядеть так:


Надеемся, что после обучения модель выдаст правильный перевод, который мы ожидаем. Конечно, это не настоящее указание на то, была ли эта фраза частью обучающего набора данных (см .: перекрестная проверка).Обратите внимание, что каждая позиция имеет небольшую вероятность, даже если она вряд ли будет результатом этого временного шага - это очень полезное свойство softmax, которое помогает процессу обучения.

Теперь, поскольку модель производит выходные данные по одному, мы можем предположить, что модель выбирает слово с наибольшей вероятностью из этого распределения вероятностей и отбрасывает остальные. Это один из способов (называемый жадным декодированием). Другой способ сделать это - удержаться, скажем, за два верхних слова (например, «I» и «a»), а затем на следующем шаге запустить модель дважды: один раз предполагая, что первая выходная позиция была слово «I», и в другой раз, предполагая, что первой выходной позицией было слово «а», и какая бы версия ни вызвала меньше ошибок, учитывая обе позиции №1 и №2, сохраняется.Мы повторяем это для позиций №2 и №3… и т. Д. Этот метод называется «поиск луча», где в нашем примере для beam_size было два (это означает, что всегда две частичные гипотезы (незавершенные переводы) сохраняются в памяти), а top_beams также равно двум (что означает, что мы вернем два перевода. ). Это оба гиперпараметра, с которыми вы можете поэкспериментировать.

Идите вперед и трансформируйте

Надеюсь, вы нашли это полезным местом, чтобы начать ломать голову над основными концепциями Трансформера.Если вы хотите углубиться, я бы посоветовал следующие шаги:

Доработки:

Благодарности

Благодарим Илью Полосухина, Якоба Ушкорейта, Ллиона Джонса, Лукаша Кайзера, Ники Пармар и Ноама Шазира за отзывы о более ранних версиях этого сообщения.

Пожалуйста, напишите мне в Твиттер для любых исправлений или отзывов.

Электрический трансформатор - Основная конструкция, работа и типы

Электрический трансформатор - это статическая электрическая машина, которая преобразует электрическую мощность из одной цепи в другую без изменения частоты.Трансформатор может увеличивать или уменьшать напряжение с соответствующим уменьшением или увеличением тока.

Принцип работы трансформатора

Основной принцип работы трансформатора - это явление взаимной индукции между двумя обмотками, связанными общим магнитным потоком. На рисунке справа показана простейшая форма трансформатора. В основном трансформатор состоит из двух индуктивных катушек; первичная обмотка и вторичная обмотка. Катушки электрически разделены, но магнитно связаны друг с другом.Когда первичная обмотка подключена к источнику переменного напряжения, вокруг обмотки создается переменный магнитный поток. Сердечник обеспечивает магнитный путь для потока, чтобы соединиться с вторичной обмоткой. Большая часть потока связана с вторичной обмоткой, которая называется «полезным потоком» или основным «потоком», а поток, который не связан с вторичной обмоткой, называется «потоком рассеяния». Поскольку создаваемый поток является переменным (его направление постоянно меняется), ЭДС индуцируется во вторичной обмотке в соответствии с законом Фарадея об электромагнитной индукции.Эта ЭДС называется «взаимно индуцированной ЭДС», и частота взаимно индуцированной ЭДС такая же, как и частота подаваемой ЭДС. Если вторичная обмотка является замкнутой цепью, то через нее протекает взаимно индуцированный ток, и, следовательно, электрическая энергия передается от одной цепи (первичной) к другой цепи (вторичной).

Базовая конструкция трансформатора

В основном трансформатор состоит из двух индуктивных обмоток и многослойного стального сердечника. Катушки изолированы друг от друга, а также от стального сердечника.Трансформатор также может состоять из контейнера для сборки обмотки и сердечника (называемого баком), подходящих вводов для подключения клемм, маслорасширителя для подачи масла в бак трансформатора для охлаждения и т. Д. На рисунке слева показана основная конструкция трансформатор.
Во всех типах трансформаторов сердечник изготавливается путем сборки (штабелирования) ламинированных листов стали с минимальным воздушным зазором между ними (для обеспечения непрерывного магнитного пути). Используемая сталь имеет высокое содержание кремния и иногда подвергается термообработке для обеспечения высокой проницаемости и низких потерь на гистерезис.Ламинированные стальные листы используются для уменьшения потерь на вихревые токи. Листы нарезаются в форме E, I и L. Чтобы избежать высокого сопротивления в стыках, листы укладываются друг на друга, чередуя стороны стыка. То есть, если стыки первой сборки листа находятся на передней стороне, стыки следующей сборки остаются на задней стороне.

Виды трансформаторов

Трансформаторы можно классифицировать по разным признакам, таким как типы конструкции, типы охлаждения и т. Д.

(A) По конструкции трансформаторы можно разделить на два типа: (i) трансформатор с сердечником и (ii) трансформатор с корпусом, которые описаны ниже.

(i) Трансформатор с сердечником

В трансформаторе с сердечником обмотки представляют собой цилиндрическую намотку, установленную на плечах сердечника, как показано на рисунке выше. Цилиндрические катушки имеют разные слои, и каждый слой изолирован друг от друга. Для изоляции можно использовать такие материалы, как бумага, ткань или слюда. Обмотки низкого напряжения располагаются ближе к сердечнику, так как их легче изолировать.

(ii) Трансформатор корпусного типа
Катушки предварительно намотаны и смонтированы слоями с изоляцией между ними.Трансформатор оболочечного типа может иметь простую прямоугольную форму (как показано на рис. Выше) или распределенную форму.

(B) В зависимости от назначения

  1. Повышающий трансформатор: Напряжение увеличивается (с последующим уменьшением тока) на вторичной обмотке.
  2. Понижающий трансформатор: Напряжение уменьшается (с последующим увеличением тока) на вторичной обмотке.
(C) В зависимости от типа питания
  1. Однофазный трансформатор
  2. Трехфазный трансформатор
(D) На основании их использования
  1. Силовой трансформатор: Используется в сети передачи, высокий рейтинг
  2. Распределительный трансформатор: Используется в распределительных сетях, сравнительно более низкий номинал, чем у силовых трансформаторов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *