КЛАССИФИКАЦИЯ СОРТОВ СОИ АМУРСКОЙ СЕЛЕКЦИИ ПО БИОХИМИЧЕСКИМ ПОКАЗАТЕЛЯМ МЕТОДОМ КЛАСТЕРИЗАЦИИ
Рубрики: АГРОНОМИЯ
Аннотация и ключевые слова
Аннотация:
Цель исследования – систематизация сортов сои амурской селекции по биохимическим показателям качества на основе кластерного анализа для рационального использования в производстве пищевых продуктов и добавок. Исследование проводили в 2018–2020 гг. в лаборатории переработки сельскохозяйственной продукции ФНЦ Всероссийского НИИ сои. Объекты исследования – 18 сортов сои селекции Всероссийского НИИ сои, выращенных в условиях Амурской области и включенных в Государственный реестр селекционных достижений Российской Федерации. В качестве признаков для кластерного анализа выбрано 13 показателей: белок, незаменимые аминокислоты (лизин, лейцин, изолейцин, валин, треонин, фенилаланин, метионин + цистеин), масло, полиненасыщенные жирные кислоты (олеиновая, линолевая, линоленовая) и активность ингибиторов трипсина. Применение методов кластерного анализа позволило сгруппировать сорта сои по критерию наибольшего сходства биохимических параметров и сформировать пять основных кластеров: 1 – Лебедушка, Журавушка, Пепелина, Золушка, Алена; 2 – Сентябринка, Интрига; 3 – Куханна, Невеста, Кружевница, Китросса, Статная, Умка; 4 – Персона, Бонус; 5 – Чародейка, Топаз, Нега 1. Основываясь на полученных результатах кластеризации, был проведен сравнительный анализ выделенных кластеров по средним значениям биохимических признаков. По белково-масличному составу выделенные кластеры сортов сои условно классифицированы на три группы: универсальные (с содержанием белка – не менее 38 %, масла – не менее 18 %), масличные (с содержанием белка – менее 38 %, масла – более 18 %) и высокобелковые (с содержанием белка – более 40 %, масла – менее 18 %).

Ключевые слова:
зерно сои, сорт, соевое сырье, биохимические показатели, белок, жир, аминокислотный состав, жирные кислоты, кластерный анализ
Текст

Введение. При выборе сырья в системе переработки сои на пищевые цели, как правило, возникает вопрос о качестве зерна, включающем различные его показатели, начиная от физических параметров, определяющих пригодность зерна сои к переработке, и заканчивая химическим составом, обуславливающим пищевую ценность того или иного продукта. Одними из важнейших критериев оценки пищевой ценности соевого зерна являются: общее содержание белка (36–48 %) и аминокислот, особенно незаменимых, таких как лизин, треонин, триптофан; масла (от 16 до 27 %) и жироподобных веществ, обеспечивающих выполнение в организме человека различных физиологических и биохимических функций [1–3]. Ценность соевого масла определяют входящие в его состав жирные кислоты, среди которых на линолевую кислоту приходится более 50 %; олеиновую – 20–36; стеариновую – 4,5–7,0; линоленовую – 3–5; пальмитиновую – 2,5–6,0 %. Семена сои также содержат значительные количества фосфолипидов, витаминов (А, D, C, E, группы В), широкий спектр макро- и микроэлементов [4, 5].

Ввиду большого сортового разнообразия и широкого спектра изучаемых признаков для их анализа и систематизации актуальное значение имеет использование многомерных статистических методов, в частности кластерного анализа. Методы кластеризации применяются в различных научно-технических областях с целью решения задач сегментации для объединения объектов в группы со схожими характеристиками, а также сжатия большого объема информации и построения научно обоснованных классификаций [6–10].

Цель исследования – систематизация сортов сои амурской селекции по биохимическим показателям качества на основе кластерного анализа для рационального использования в производстве пищевых продуктов и добавок.

Задачи: провести кластерный анализ сортов сои по критерию наибольшего сходства биохимических признаков; дать сравнительную оценку выделенных кластеров по степени выраженности признаков; определить группы сортов с комплексом качественных показателей.

Объекты и методы. Исследование проводилось в 2018–2020 гг. в лаборатории переработки сельскохозяйственной продукции ФНЦ ВНИИ сои. В качестве объектов исследования были взяты 18 сортов сои селекции Всероссийского НИИ сои, выращенных в условиях Амурской области и включенных в Государственный реестр селекционных достижений РФ: Персона, Бонус, Сентябринка, Интрига, Чародейка, Топаз, Нега 1, Куханна, Невеста, Кружевница, Китросса, Статная, Умка, Пепелина, Золушка, Алена, Лебедушка, Журавушка [11]. Образцы для исследования получены из коллекционных питомников опытного поля лаборатории селекции и генетики сои ФНЦ ВНИИ сои. Отбор проб исследуемых образцов проводили в фазу полной спелости зерна в соответствии с ГОСТ 13586.3-2015.

В ходе биохимических исследований зерна сои была сформирована база данных и определена совокупность основных признаков, характеризующих качество зерна, по которым осуществлялась группировка сортов. В качестве признаков для кластерного анализа было выбрано 13 показателей: белок, незаменимые аминокислоты (лизин, лейцин, изолейцин, валин, треонин, фенилаланин, метионин + цистеин), масло, жирные кислоты (олеиновая, линолевая, линоленовая), активность ингибиторов трипсина.

Содержание белка, масла, аминокислотный состав и жирные кислоты определяли методом диффузного отражения света в инфракрасной области спектра на ИК-сканере модели FOSS NIR Systems 5000 (Дания). Для определения белка и масла в зерне сои использовали стандартные калибровочные уравнения фирмы FOSS Analytical A/S в соответствии с ГОСТ 32749-2014. Калибровочные уравнения для определения состава аминокислот и жирных кислот разрабатывались в 2009–2010 гг. в аналитической группе ВНИИ сои [5, 12]. Трипсинингибирующую активность (ТИА) измеряли с помощью спектрофотометра Cary 50 (VARIAN) в соответствии с ГОСТ 33427-2015.

Статистическую обработку данных проводили с использованием пакета программ MS Excel и STATISTICA 10, используя метод кластерного анализа [13]. В качестве алгоритма кластеризации использовали метод Варда (мера близости объектов – Манхэттенское расстояние) и метод k-средних (5 кластеров, 10 итераций). Показатели с различиями в размерных единицах были приведены в единую систему методом стандартизации средних значений каждого признака в диапазоне от –2,7 до +2,7 ед. При выборе числа кластеров уровень сходства 15 % считали оптимальным. Проверку различий между кластерами по каждому признаку рассчитывали методом параметрического дисперсионного анализа.

Результаты и их обсуждение. На основании средних стандартизированных значений биохимических признаков был проведен кластерный анализ методом Варда, результатом которого являлось построение дендрограммы в виде графической последовательности объединения и разделения сортов сои на кластеры (рис. 1).

 

 

 

Рис. 1. Дендрограмма сходства-различия сортов сои по комплексу биохимических признаков

 

Анализ дендрограммы позволил сгруппировать сорта сои по принципу минимального взаимодействия внутри группы и максимального – между кластерами и сформировать пять основных кластеров, наиболее схожих по комплексу изучаемых признаков:

1-й кластер – Лебедушка, Журавушка, Пепелина, Золушка, Алена;

2-й кластер – Сентябринка, Интрига;

3-й кластер – Куханна, Невеста, Кружевница, Китросса, Статная, Умка;

4-й кластер – Персона, Бонус;

5-й кластер – Чародейка, Топаз, Нега 1.

Для получения более детальной информации о выделенных кластерах и оценки результатов биохимических параметров исследуемых сортов сои на следующем этапе исследований применяли метод k-средних. Оценку качества кластеризации наблюдений и проверку значимости различий кластеров по исследуемым характеристикам проводили посредством параметрического дисперсионного анализа, используя процедуру, сравнивающую внутрикластерные и межкластерные дисперсии по каждому признаку (табл. 1).

 

Таблица 1

Результаты дисперсионного анализа кластеризации

наблюдений по биохимическим признакам (при р = 0,05)

 

Признак

Межгрупповая

дисперсия

Число

степеней свободы

Внутригрупповая

дисперсия

Число

степеней свободы

F

Уровень значимости p

Белок

13,70976

4

3,29024

13

13,54209

0,000144

Лизин

14,38596

4

2,61404

13

17,88583

0,000034

Лейцин

12,12472

4

4,87528

13

8,08269

0,001679

Изолейцин

13,56465

4

3,43535

13

12,83279

0,000189

Валин

13,84803

4

3,15197

13

14,27872

0,000110

Фенилаланин

14,40611

4

2,59389

13

18,05009

0,000032

Треонин

14,78626

4

2,21374

13

21,70775

0,000012

Метионин + цистеин

14,94572

4

2,05428

13

23,64504

0,000007

Масло

13,75742

4

3,24258

13

13,78889

0,000132

Олеиновая

13,48962

4

3,51038

13

12,48904

0,000217

Линолевая

15,44616

4

1,55384

13

32,30710

0,000001

Линоленовая

14,65846

4

2,34154

13

20,34562

0,000017

ТИА

13,65342

4

1,24658

13

20,49110

0,000152

 

 

Результаты дисперсионного анализа указывают на высокое качество разбиения 18 наблюдений на 5 кластеров по каждому показателю, поскольку признаком качественной классификации является минимум изменчивости внутри кластера и максимум между кластерами.

Для визуализации полученных результатов была реализована процедура построения усредненных графиков, демонстрирующих значимые отличия кластеров и степень выраженности биохимических признаков (рис. 2). Анализ графиков позволил провести градацию наблюдений в порядковой шкале стандартизированных значений, где в качестве уровня «средний +» – стандартизированный интервал (0,0; +0,7), «выше среднего» – (> +0,7), «средний –» – стандартизированный интервал (0,0; –0,7), «ниже среднего» –
(< –0,7)
. Результаты, полученные методом
k-средних, в полной мере соответствуют дендрограмме, построенной методом иерархической кластеризации.

Основываясь на полученных результатах кластеризации, проведен сравнительный анализ выделенных кластеров по средним значениям биохимических признаков (табл. 2).

 

 

 

Рис. 2. Графики средних стандартизированных значений для каждого кластера

 

Таблица 2

Сравнительный анализ биохимических признаков

сортов сои амурской селекции по кластерам (M±∆ при р = 0,05)

 

Признак

Среднее значение за три года, %

Кластер 1

Кластер 2

Кластер 3

Кластер 4

Кластер 5

Белок

37,21±0,66

38,10±0,48

39,11±0,38

41,10±0,19

36,83±0,37

Лизин

6,07±0,29

6,04±0,22

5,92±0,60

5,73±0,82

6,27±0,11

Лейцин

8,28±0,65

7,91±0,07

8,14±0,78

7,83±0,21

8,20±0,36

Изолейцин

5,69±0,51

5,67±0,31

5,81±0,55

6,01±0,84

5,34±0,21

Валин

7,14±0,66

6,78±0,25

6,72±0,38

6,16±0,36

7,48±0,34

Фенилаланин

4,27±0,56

4,27±0,66

4,33±0,17

4,39±0,66

4,20±0,09

Треонин

3,44±0,41

3,32±0,34

3,35±0,44

3,20±0,68

3,40±0,07

Метионин + цистеин

1,73±0,22

1,75±0,02

1,61±0,52

1,46±0,48

1,94±0,50

Масло

18,89±0,61

19,12±0,39

18,06±0,30

17,46±0,86

20,23±0,22

Олеиновая (ω9)

18,74±0,39

20,61±0,11

21,65±0,31

23,79±1,45

18,5±0,36

Линолевая (ω6)

50,83±0,36

50,91±0,01

50,36±0,33

50,05±0,49

51,46±0,34

Линоленовая (ω3)

6,58±0,49

7,23±0,32

8,01±0,33

9,85±1,71

5,41±0,12

ТИА, мг/г

22,84±0,62

23,57±1,11

23,17±1,16

23,14±0,93

24,29±1,07

 

 

Первый кластер представлен группой сортов сои, отличающихся средними показателями белка (37,2 %) и масла (18,9 %), высокой концентрацией незаменимых аминокислот (лейцина, треонина) и минимальным уровнем трипсинигибирующей активности, являющимся одним из важных показателей в зерне сои пищевого направления.

Сорта второго и третьего кластеров по изучаемым признакам значимо не отличались друг от друга и характеризовались средними значениями по всем показателям. При этом третий кластер образуют сорта со значениями признаков выше среднего по содержанию фенилаланина (4,3 %) в белке и олеиновой кислоты (21,7 %) в масле, а также значениями ниже среднего по признакам содержания метионина+цистеина (1,6 %) в белке, масла (18,1 %) и линолевой кислоты (50,4 %).

Наибольшие различия по большинству признаков выявлены в четвертом и пятом кластерах. Сорта, сформировавшие четвертый кластер, отличались максимальными значениями признаков белка (41,1 %), изолейцина (6,0 %), фенилаланина (4,4 %), а также олеиновой и линоленовой кислот (соответственно 23,8 и 9,9 %). Помимо этого в сортах четвертого кластера отмечено наибольшее значение суммы полиненасыщенных жирных кислот в масле – 83,8 %, доля данных кислот в сортах сои других кластеров составила 75,4–80,1 %.

Пятый кластер представлен высокомасличными сортами с повышенным содержанием линолевой (ω6) и минимальным – линоленовой (ω3) кислот, что делает эти сорта перспективными для производства масла на пищевые цели. Кроме того, представители этого кластера отличались наибольшим содержанием лизина, валина и метионина + цистеина. Поскольку сорта в этой группе являются высоколизиновыми, то их можно рекомендовать для использования в произ­водстве лизина в качестве пищевой добавки.

Следует отметить, что, несмотря на межсортовые различия, представители всех кластеров имеют сбалансированный аминокислотный состав и оптимальное соотношение ω6 и ω3 жирных кислот (5,1–9,5:1), что соответствует нормам физиологической потребности взрослого человека [14].

По белково-масличному составу зерна выделенные кластеры сортов сои условно классифицированы на три группы: универсальные (с содержанием белка – не менее 38 %, масла – не менее 18 %), масличные (с содержанием белка – менее 38 %, масла – более 18 %), высокобелковые (с содержанием белка – более 40 %, масла – менее 18 %) [15].

Универсальную группу сформировали второй и третий кластеры, включающие сорта Сентябринка, Интрига, Куханна, Невеста, Кружевница, Китросса, Статная, Умка, которые могут быть использованы как для производства масла, так и белковых продуктов. Масличная группа объединила первый и пятый кластеры, включающие сорта: Лебедушка, Журавушка, Пепелина, Золушка, Алена, Чародейка, Топаз, Нега 1, – соответственно их лучше использовать в маслоэкстракционном производстве. В высокобелковую группу вошли сорта четвертого кластера (Чародейка, Топаз, Нега 1), они наиболее пригодны для производства соевой муки, белковых концентратов, изолятов, текстуратов, соевого молока, пищевых добавок и т. д.

Заключение. Применение методов кластерного анализа позволило систематизировать сорта сои по степени выраженности биохимических параметров зерна, сформировать пять основных кластеров, наиболее схожих по комплексу изучаемых признаков, и провести их сравнительную оценку. Определены три группы сортов по критериям белково-масличного состава (универсальные, масличные, высокобелковые), что позволит обеспечить целенаправленный выбор сырья в производстве пищевых продуктов (добавок) и прогнозирование качества готовой продукции.

Список литературы

1. Смагина А.В., Сытова М.В. Анализ использования соевого белка в пищевой промышленности // Научные труды Дальрыбвтуза. 2011. Т. 23. С. 73–78.

2. Петибская В.С., Кучеренко Л.А., Зелен-цов С.В. Использование сортового разнообразия семян сои для увеличения арсенала пищевых и функциональных продуктов // Масличные культуры. Научно-технический бюллетень Всероссийского научно-исследовательского института масличных культур. 2006. № 2 (135). С. 115–121.

3. Могильный М.П. Биотехнологическая характеристика соевых продуктов // Естественные науки. 2007. № 6. С. 87–92.

4. Лысиков Ю.А. Аминокислоты в питании человека // Экспериментальная и клиническая гастроэнтерология. 2012. № 2. С. 88–105.

5. Низкий С.Е., Кодирова Г.А., Кубанкова Г.В. Оценка содержания ω-кислот в сортах сои амурской селекции // Достижения науки и техники АПК. 2020. Т. 34, № 8. С. 44–49. DOI:https://doi.org/10.24411/0235-2451-2020-10800.

6. Иванищев В.В. О возможности приложения метода кластерного анализа к результатам физиолого-биохимических исследований растений // Известия ТулГУ. Естественные науки. 2018. Вып. 1. С. 69–77.

7. Cluster analysis to select peanut drought tole-rance lines / J.W. de Lima Pereira [et al.] // Aust. J. of Crop Sci. 2015. V. 9 (11). P. 1095–1105.

8. Physiological and biochemical parameters for evaluation and clustering of rice cultivars differing in salt stress at seedling stage / S. Chunthaburee [et al.] // Saudi J. Biol. Sci. 2016. V. 23(4). P. 467–477.

9. Klyuchko O.M. Cluster analysis in biotechno-logy // Biotechnologia Acta. 2017. V.10. No 5. P. 5–18.

10. Variability of Phytochemicals by Breeding Year, Usage and Seed Size of Korean Soybean (Glycine max (L.) Merrill) Varieties / Tae-Young Hwang [et al.] // Agriculture. 2020. V. 10. P. 100. DOI:https://doi.org/10.3390/agriculture10040100.

11. Каталог сортов сои / Е.М. Фокина [и др.]; под общ. ред. В.Т. Синеговской; ВНИИ сои. Благовещенск: ОДЕОН, 2021. 69 с.

12. Низкий С.Е., Кодирова Г.А., Кубанкова Г.В. Особенности калибровочных уравнений для ИК-сканеров при определении аминокислотного состава белков сои // Вестник ДВО РАН. 2020. № 4. С. 131–135. DOI:https://doi.org/10.37102/08697698.2020.212.4.021.

13. Буреева Н.Н. Многомерный статистический анализ с использованием ППП «STATIS-TICA»: учеб.-метод. материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Н. Новгород, 2007. 112 с.

14. MP 2.3.1.0253-21. Нормы физиологических потребностей в энергии и пищевых веществах для различных групп населения Российской Федерации (утв. Федеральной службой по надзору в сфере защиты прав потребителей и благополучия человека 22 июля 2021 г.). URL: https://base.garant.ru/ 402816140.

15. Щелко Л.Г., Седова Т.С., Корнейчук В.А. Международный классификатор СЭВ рода Glycine Willd / Науч.-техн. совет стран – членов СЭВ по коллекциям диких культурных видов растений. Ленинград: Изд-во ВИР, 1990. 38 с.


Войти или Создать
* Забыли пароль?