2021數學建模美賽D題-翻譯與思路提供

題目翻譯

音樂從一開始就是人類社會的一部分,是文化遺產的重要組成部分。爲了理解音樂在人類集體經驗中所扮演的角色,我們被要求開發一種量化音樂進化的方法。當藝術家創作一段新的音樂時,有許多因素會影響他們,包括他們天生的創造力,當前的社會或政治事件,使用新樂器或工具,或其他個人經歷。我們的目標是瞭解和衡量之前製作的音樂對新音樂和音樂藝術家的影響。

一些藝術家可以列出十幾個甚至更多的其他藝術家,他們說他們影響了自己的音樂作品。也有人認爲,影響可以通過歌曲特徵(如結構、節奏或歌詞)之間的相似程度來衡量。有時,音樂也會發生革命性的轉變,提供新的聲音或節奏,例如當一種新的流派出現,或現有流派的重新發明(如古典、流行/搖滾、爵士等)。這可能是由於一系列的小變化,藝術家的合作努力,一系列有影響力的藝術家,或社會內部的轉變。

許多歌曲都有相似的聲音,許多藝術家爲音樂流派的重大轉變做出了貢獻。有時這些變化是由於一個藝術家影響另一個藝術家。有時是對外部事件(如世界重大事件或技術進步)的反應而產生的變化。通過考慮歌曲網絡及其音樂特徵,我們可以開始捕捉音樂藝術家對彼此的影響。也許,我們也可以更好地瞭解音樂是如何隨着社會的變遷而演變的。

你的團隊已經被綜合集體音樂(ICM)協會確定爲一個衡量音樂影響力的模型。這個問題要求你審視藝術家和流派的進化和革命趨勢。爲了做到這一點,你的團隊得到了ICM提供的幾個數據集:

1代表音樂領域的影響者和追隨者,這不僅來自藝人自己的報道,也來自行業專家的觀點。這些數據包含了過去90年裏5854位藝術家的影響者和追隨者。

2)“full_music_data”2提供了16個變量條目,包括音樂功能,如舞蹈性,節奏,響度,和鍵,以及每個98340首歌曲的artist_name和artist_id。這些數據用於創建兩個彙總數據集,包括:

a.藝術家“data_by_artist”的平均值,

b.表示年份“data_by_year”。

這些數據是從http://AllMusic.com上搜集來的
2這些數據來自Spotify的API

注意:這些文件中提供的數據是更大數據集的子集。這些文件包含您應該用於解決這個問題的唯一數據。

爲了完成這個具有挑戰性的項目,ICM協會要求您的團隊通過以下方式來探索音樂的演變,通過對音樂藝術家的影響來進行研究:

•使用influence_data數據集或其部分來創建一個(多個)定向的音樂影響力網絡,其中影響者與追隨者相連。開發在這個網絡中捕捉“音樂影響”的參數。通過創建直接影響者網絡的子網絡來探索音樂影響的子網絡。描述這個子網。你的“音樂影響”指標在這個子網中揭示了什麼?

•使用full_music_data和/或音樂特徵的兩個總結數據集(包含藝術家和年份),來開發音樂相似性度量。使用你的衡量標準,同一類型的藝術家是否比不同類型的藝術家更相似?

•比較不同類型之間的相似性和影響。類型的區別是什麼?類型是如何隨着時間變化的?有些類型與其他類型有關聯嗎?

•指出data_influence數據集中報告的相似度數據是否表明所識別的影響者實際上影響了各自的藝術家。這些“影響者”真的會影響粉絲創作的音樂嗎?是某些音樂特徵比其他特徵更具有“感染力”,還是它們在影響特定藝術家的音樂方面都有相似的作用?

•從這些數據中確定是否有特徵可能標誌着音樂進化的革命(主要飛躍)?哪些藝術家代表了你網絡中的革命者(重大變化的影響者)?

•分析一種音樂流派隨時間推移而發生的音樂演變的影響過程。你的團隊能否識別出能夠揭示動態影響因素的指標,並解釋類型或藝術家是如何隨着時間而改變的?

•你的作品如何表達音樂在時間或環境中的文化影響?另外,如何在網絡內識別社會、政治或技術變革(如互聯網)的影響?
向ICM協會寫一份一頁紙的文件,說明使用你的方法通過網絡瞭解音樂影響的價值。考慮到這兩個問題數據集僅侷限於某些類型,隨後又侷限於這兩個數據集所共有的藝術家,你的工作或解決方案將如何隨着更多或更豐富的數據而改變?建議進一步研究音樂及其對文化的影響。

ICM協會,一個來自音樂,歷史,社會科學,技術和數學領域的跨學科和多樣化的團體,期待你的最終報告。

不超過25頁的PDF解決方案應該包括:
•一頁摘要表。
•目錄。
•您的完整解決方案。
•提交給ICM協會的一頁文件。
•引用列表。
注意:新的2021年!ICM競賽現在有了25頁的限制。你提交的所有方面都在25頁的限制之內:摘要表,目錄,解決方案的主體,圖像和表格,一頁的文檔,參考列表,和任何附錄。
附件
針對這個問題,我們提供了以下四個數據文件。所提供的數據文件包含您應該用於此問題的唯一數據。







  1. influence_data.csv
  2. full_music_data.csv
  3. data_by_artist.csv
  4. data_by_year.csv數據描述
  5. influence_data.csv
    (數據以utf-8編碼,以允許處理特殊字符):
  • influencer_id:一個唯一的識別號碼,給人列出的影響者。(數字的字符串)
  • influencer_name:追隨者或行業專家給出的具有影響力的藝術家的名稱。(字符串)
  • influencer_main_genre:最能描述受影響藝術家創作的大部分音樂的類型。(如果可用)(字符串)
  • influencer_active_start:有影響力的藝術家開始他們的音樂生涯的十年。(整數)
  • follower_id:一個唯一的識別號碼給藝術家列爲追隨者。(數字的字符串)
    —follower_name:受影響的藝術家後面的藝術家的名稱。(字符串)
  • follower_main_genre:最能描述以下藝術家創作的大部分音樂的類型。(如果可用)(字符串)
  • follower_active_start:以下藝術家開始音樂生涯的十年。(整數)
  1. full_music_data.csv 3。data_by_artist.csv 4。data_by_year.csv
    Spotify音頻功能從“full_music_data”,“data_by_artist”,“data_by_year”:
  • artist_name:演奏這首歌的藝人。(數組)
    —artist_id:與“influence_data.csv”文件中給出的唯一標識號相同。(數字的字符串)
    音樂特點:
    -舞蹈性:根據音樂元素的組合,包括節奏、節奏穩定性、拍子力度和整體規律性,來衡量一個曲目是否適合跳舞。0.0是最不適合跳舞的值,1.0是最適合跳舞的值。(浮動)
    -能量:表示強度和活動的量度。0.0是強度最小的值,1.0是強度最大的值。通常,充滿能量的軌道給人的感覺是快速、響亮和嘈雜的。例如,死亡金屬的能量很高,而巴赫的序曲在音階上得分較低。對這一屬性有貢獻的感知特徵包括動態範圍、感知到的響度、音色、發作率和一般熵。(浮動)
    效價:描述音軌所傳達的樂感的一種量度。0.0是最負的值,1.0是最正的值。高效價音軌聽起來更積極(如快樂、快樂、欣快),而低效價音軌聽起來更消極(如悲傷、抑鬱、憤怒)。(浮動)
    -節奏:在每分鐘節拍(BPM)的軌道的總體估計速度。在音樂術語中,節奏是一個給定的作品的速度或節奏,直接來源於平均拍子持續時間。(浮動)
    —響度:音軌的整體響度,單位爲分貝(dB)。數值的典型範圍在-60到0分貝之間。響度值平均橫跨整個軌道,是有用的比較軌道的相對響度。響度是聲音的性質,是與身體力量(振幅)的主要心理關聯。(浮動)
    調式:音軌中調式(大調或小調)的一種表示,調式是音階的一種類型,它的旋律內容來源於此。大調用1表示,小調用0表示。
    -關鍵:估計的整體關鍵的軌道。整數使用標準音高類表示法映射到音高。如0 = C、1 = C広場/♭,2 = D等。如果未檢測到鍵值,則鍵值爲-1。(整數)
    類型的聲音:
    -音色:一種確定賽道是否爲音色(沒有技術增強或電子放大)的置信度。1.0代表音軌的高度置信度。(浮動)
    —工具性:預測音軌中是否沒有人聲。“Ooh”和“aah”的聲音在這個語境中被視爲有用的。說唱或口語的音軌是明顯的“聲音”。工具性值越接近1.0,這首歌就越有可能不包含聲樂內容。高於0.5的值表示工具性軌跡,但當值接近1.0時,置信度更高。(浮動)
    -活躍度:檢測軌道中是否有觀衆。較高的活度值表示實時執行跟蹤的可能性增加。如果該值高於0.8,則表明該軌道很有可能是實時的。(浮動)
    —語音:檢測語音軌跡中是否存在語音。越是專門的演講——比如錄音(例如脫口秀、有聲讀物、詩歌),屬性值越接近1.0。高於0.66的值表示可能完全由口語單詞組成的音軌。0.33到0.66之間的值描述了既包含音樂又包含語言的音軌,可以是分段的,也可以是分層的,包括說唱音樂這樣的情況。低於0.33的值很可能代表音樂和其他非語言類音軌。(浮動)













  • explicit:檢測明確的歌詞在一個軌道(true(1) =是的;false(0) =不存在或未知)。(布爾)
    描述:
    —duration_ms:磁道持續時間,單位爲毫秒。(整數)
    -人氣:該賽道的受歡迎程度。該值將在0到100之間,其中100是最常用的。流行度是通過算法來計算的,在很大程度上是基於這首歌的總播放次數以及這些播放的最近時間。一般來說,現在播放頻率更高的歌曲會比過去播放頻率更高的歌曲更受歡迎。重複的音軌(例如,來自一個單曲和專輯的相同的音軌)是獨立評級的。藝術家和專輯的流行度是由歌曲的流行度計算出來的。(整數)


  • year:單曲發行的年份。(1921 - 2020的整數)
    release_date:音軌發佈的日曆日期,大多是yyyy-mm-dd格式,但日期的精度可能會有所不同,有些只給出yyyy。
  • song_title(審查):音軌的名稱。(字符串)軟件運行刪除任何潛在的顯式文字在歌曲的標題。
  • count:在full_music_data.csv文件中表示某個藝術家的歌曲數量。(整數)

解題思路

需要解題思路的同學+q羣
961772806

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章