如何使用ML.NET构建推荐系统？

原創

2021-06-07 15:24

\n \/\/\/ Base class for Trainers.\n \/\/\/ This class exposes methods for training, evaluating and saving ML Models.\n \/\/\/ \n public abstract class TrainerBase : ITrainerBase\n {\n public string Name { get; protected set; }\n \n protected static string ModelPath => Path.Combine(AppContext.BaseDirectory, \n \"recommender.mdl\");\n\n protected readonly MLContext MlContext;\n\n protected DataOperationsCatalog.TrainTestData _dataSplit;\n protected ITrainerEstimator _model;\n protected ITransformer _trainedModel;\n\n protected TrainerBase()\n {\n MlContext = new MLContext(111);\n }\n\n \/\/\/

\n \/\/\/ Train model on defined data.\n \/\/\/ \n \/\/\/ \n public void Fit(string trainingFileName)\n {\n if (!File.Exists(trainingFileName))\n {\n throw new FileNotFoundException($\"File {trainingFileName} doesn't exist.\");\n }\n\n _dataSplit = LoadAndPrepareData(trainingFileName);\n var dataProcessPipeline = BuildDataProcessingPipeline();\n var trainingPipeline = dataProcessPipeline.Append(_model);\n\n _trainedModel = trainingPipeline.Fit(_dataSplit.TrainSet);\n }\n\n \/\/\/

\n \/\/\/ Evaluate trained model.\n \/\/\/ \n \/\/\/ RegressionMetrics object.\n public RegressionMetrics Evaluate()\n {\n var testSetTransform = _trainedModel.Transform(_dataSplit.TestSet);\n\n return MlContext.Regression.Evaluate(testSetTransform);\n }\n\n \/\/\/

\n \/\/\/ Save Model in the file.\n \/\/\/ \n public void Save()\n {\n MlContext.Model.Save(_trainedModel, _dataSplit.TrainSet.Schema, ModelPath);\n }\n\n \/\/\/

\n \/\/\/ Feature engeneering and data pre-processing.\n \/\/\/ \n \/\/\/ Data Processing Pipeline.\n private EstimatorChain BuildDataProcessingPipeline()\n {\n var dataProcessPipeline = MlContext.Transforms.Conversion.MapValueToKey(\n inputColumnName: \"UserId\",\n outputColumnName: \"UserIdEncoded\")\n .Append(MlContext.Transforms.Conversion.MapValueToKey(\n inputColumnName: \"MovieId\",\n outputColumnName: \"MovieIdEncoded\"))\n .AppendCacheCheckpoint(MlContext);\n\n return dataProcessPipeline;\n }\n\n private DataOperationsCatalog.TrainTestData LoadAndPrepareData(string trainingFileName)\n {\n IDataView trainingDataView = MlContext.Data.LoadFromTextFile\n (trainingFileName, hasHeader: true, separatorChar: ',');\n return MlContext.Data.TrainTestSplit(trainingDataView, testFraction: 0.1);\n }\n }\n}\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这是一个大类，它控制着整个过程。我们把它拆开，看看它到底是怎么回事。首先，我们观察这个类的字段和属性："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"public string Name { get; protected set; }\n \n protected static string ModelPath => Path.Combine(AppContext.BaseDirectory, \n \"recommender.mdl\");\n\n protected readonly MLContext MlContext;\n\n protected DataOperationsCatalog.TrainTestData _dataSplit;\n protected ITrainerEstimator _model;\n protected ITransformer _trainedModel;\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"继承该属性的类使用 Name 属性为算法添加名称。ModelPath 字段用于定义模型训练完成后将其存储在何处。注意，文件名的扩展名是 .mdl。接下来是 MlContext，以便我们能够使用 ML.NET 的功能。不要忘记，这个类是一个单例，因此在我们的解决方案中只有一个。_dataSplit 字段包含加载的数据。该结构将数据分割成训练数据集和测试数据集。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"子类将使用字段 _model。这些类定义了该字段中使用哪种机器学习算法。_trainedModel 字段是结果模型，应该对其进行评估和保存。从本质上讲，继承和实现此类的唯一工作是定义应该使用的算法，通过实例化作为 _model 的所需算法的对象。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"现在让我们来探索 Fit() 方法："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"public void Fit(string trainingFileName)\n{\n if (!File.Exists(trainingFileName))\n {\n throw new FileNotFoundException($\"File {trainingFileName} doesn't exist.\");\n }\n\n _dataSplit = LoadAndPrepareData(trainingFileName);\n var dataProcessPipeline = BuildDataProcessingPipeline();\n var trainingPipeline = dataProcessPipeline.Append(_model);\n\n _trainedModel = trainingPipeline.Fit(_dataSplit.TrainSet);\n}\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这个方法是训练算法的蓝图。它接收 .csv 文件的路径作为输入参数。确定文件存在之后，我们使用私有方法 loadAndPrepareData。该方法将数据加载到内存中，并将其分割成两个数据集，即训练数据集和测试数据集。在 _dataSplit 中保存返回值，因为我们需要一个用于评估阶段的测试数据集。接着我们调用 BuildDataProcessingPipeline()。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这就是进行数据预处理和特征工程的方法。对于这些数据，无需做大量工作，我们只需通过以下方式对其进行编码："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":" private EstimatorChain BuildDataProcessingPipeline()\n {\n var dataProcessPipeline = MlContext.Transforms.Conversion.MapValueToKey(\n inputColumnName: \"UserId\",\n outputColumnName: \"UserIdEncoded\")\n .Append(MlContext.Transforms.Conversion.MapValueToKey(\n inputColumnName: \"MovieId\",\n outputColumnName: \"MovieIdEncoded\"))\n .AppendCacheCheckpoint(MlContext);\n\n return dataProcessPipeline;\n }\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"接下来是 Evaluate() 方法："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"public RegressionMetrics Evaluate()\n{\n var testSetTransform = _trainedModel.Transform(_dataSplit.TestSet);\n\n return MlContext.Regression.Evaluate(testSetTransform);\n}\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"通过使用 _trainedModel 和测试数据集创建 Transformer 对象是一种非常简单的方法。接着，利用 MlContext 来检索回归指标。最后，让我们看看 Save() 方法。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"public void Save()\n{\n MlContext.Model.Save(_trainedModel, _dataSplit.TrainSet.Schema, ModelPath);\n}\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这是另一个简单的方法，只是使用 MLContext 将模型保存到定义的路径中。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"5.4 训练器"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"因为我们在 TrainerBase 类中完成了所有繁重的工作，所以唯一的 Trainer 类非常简单，只专注于 ML.NET 算法的实例化。下面看看 RandomForestTrainer 类："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"using Microsoft.ML;\nusing Microsoft.ML.Trainers.Recommender;\nusing RecommendationSystem.MachineLearning.Common;\n\nnamespace RecommendationSystem.MachineLearning.Trainers\n{\n \/\/\/

\n \/\/\/ Class that uses Decision Tree algorithm.\n \/\/\/ \n public sealed class MatrixFactorizationTrainer : TrainerBase\n {\n public MatrixFactorizationTrainer(int numberOfIterations, \n int approximationRank, \n double learningRate) : base()\n {\n Name = $\"Matrix Factorization {numberOfIterations}-{approximationRank}\";\n\n _model = MlContext.Recommendation().Trainers.MatrixFactorization(\n labelColumnName: \"Label\",\n matrixColumnIndexColumnName: \"UserIdEncoded\",\n matrixRowIndexColumnName: \"MovieIdEncoded\",\n approximationRank: approximationRank,\n learningRate: learningRate,\n numberOfIterations: numberOfIterations);\n }\n }\n}\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"正如你所看到的那样，这个类非常简单。我们覆写了 Name 和 _model。在 Recommendation 扩展中使用 MatrixFactorization 类。注意，我们是如何使用这个算法所提供的一些超参数的。有了这个，我们可以做更多的实验。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"5.5 预测器"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Predictor 类用于加载保存的模型并运行一些预测。通常，这个类与训练器不是同一个微服务的一部分。我们通常有一个微服务来执行模型的训练。该模型被保存到文件中，其他模型从该文件加载该模型，并基于用户输入运行预测。该类看上去如下："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"using RecommendationSystem.MachineLearning.DataModels;\nusing Microsoft.ML;\nusing System;\nusing System.IO;\n\nnamespace RecommendationSystem.MachineLearning.Predictors\n{\n \/\/\/

\n \/\/\/ Loads Model from the file and makes predictions.\n \/\/\/ \n public class Predictor\n {\n protected static string ModelPath => Path.Combine(AppContext.BaseDirectory, \n \"recommender.mdl\");\n private readonly MLContext _mlContext;\n\n private ITransformer _model;\n\n public Predictor()\n {\n _mlContext = new MLContext(111);\n }\n\n \/\/\/

\n \/\/\/ Runs prediction on new data.\n \/\/\/ \n \/\/\/ New data sample.\n \/\/\/ Prediction object\n public MovieRatingPrediction Predict(MovieRating newSample)\n {\n LoadModel();\n\n var predictionEngine = _mlContext.Model.CreatePredictionEngine(_model);\n\n return predictionEngine.Predict(newSample);\n }\n\n private void LoadModel()\n {\n if (!File.Exists(ModelPath))\n {\n throw new FileNotFoundException($\"File {ModelPath} doesn't exist.\");\n }\n\n using (var stream = new FileStream(ModelPath, FileMode.Open, FileAccess.Read, \n FileShare.Read))\n {\n _model = _mlContext.Model.Load(stream, out _);\n }\n\n if (_model == null)\n {\n throw new Exception($\"Failed to load Model\");\n }\n }\n }\n}\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"简单地说，模型是从已定义的文件加载，并预测新的样本。要做到这一点，我们需要创建 PredictionEngine 来执行此操作。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"5.6 用法和结果"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"让我们把所有这些放在一起。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"using RecommendationSystem.MachineLearning.Common;\nusing RecommendationSystem.MachineLearning.DataModels;\nusing RecommendationSystem.MachineLearning.Predictors;\nusing RecommendationSystem.MachineLearning.Trainers;\nusing System;\nusing System.Collections.Generic;\n\nnamespace RecommendationSystem\n{\n class Program\n {\n static void Main(string[] args)\n {\n var newSample = new MovieRating\n {\n UserId = 6,\n MovieId = 11\n };\n\n var trainers = new List\n {\n new MatrixFactorizationTrainer(10, 50, 0.1),\n new MatrixFactorizationTrainer(10, 50, 0.01),\n new MatrixFactorizationTrainer(20, 100, 0.1),\n new MatrixFactorizationTrainer(20, 100, 0.01),\n new MatrixFactorizationTrainer(30, 100, 0.1),\n new MatrixFactorizationTrainer(30, 100, 0.01)\n\n };\n\n trainers.ForEach(t => TrainEvaluatePredict(t, newSample));\n }\n\n static void TrainEvaluatePredict(ITrainerBase trainer, MovieRating newSample) \n {\n Console.WriteLine(\"*******************************\");\n Console.WriteLine($\"{ trainer.Name }\");\n Console.WriteLine(\"*******************************\");\n\n trainer.Fit(\".\\\\Data\\\\recommendation-ratings.csv\");\n\n var modelMetrics = trainer.Evaluate();\n\n Console.WriteLine($\"Loss Function: {modelMetrics.LossFunction:0.##}{Environment.NewLine}\" +\n $\"Mean Absolute Error: {modelMetrics.MeanAbsoluteError:#.##}{Environment.NewLine}\" +\n $\"Mean Squared Error: {modelMetrics.MeanSquaredError:#.##}{Environment.NewLine}\" +\n $\"RSquared: {modelMetrics.RSquared:0.##}{Environment.NewLine}\" +\n $\"Root Mean Squared Error: {modelMetrics.RootMeanSquaredError:#.##}\");\n\n trainer.Save();\n\n var predictor = new Predictor();\n var prediction = predictor.Predict(newSample);\n Console.WriteLine(\"------------------------------\");\n Console.WriteLine($\"Prediction: {prediction.Score:#.##}\");\n Console.WriteLine(\"------------------------------\");\n }\n }\n}\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"非 TrainEvaluatePredict() 方法在这里做的是重头戏。使用这个方法，我们可以注入继承 TrainerBase 类的一个实例，以及一个新的样本，以便进行预测。接着调用 Fit() 方法对算法进行训练，并调用 Evaluate() 方法、打印出指标。最后，我们保存该模型。这样做之后，我们创建一个 Predictor 的实例，用一个新的样本调用 Predict() 方法，并打印出预测结果。在 Main 中，我们创建一个训练器对象列表，然后在这些对象上调用 TrainEvaluatePredict。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们根据这些超参数创建了算法列表中随机森林的一些变体。结果如下："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"codeblock","attrs":{"lang":"text"},"content":[{"type":"text","text":"*******************************\nMatrix Factorization 10-50\n*******************************\niter tr_rmse obj\n 0 1.4757 2.4739e+05\n 1 0.9161 1.2617e+05\n 2 0.8666 1.1798e+05\n 3 0.8409 1.1348e+05\n 4 0.8240 1.1079e+05\n 5 0.8100 1.0897e+05\n 6 0.7980 1.0736e+05\n 7 0.7847 1.0575e+05\n 8 0.7691 1.0405e+05\n 9 0.7549 1.0284e+05\nLoss Function: 0.77\nMean Absolute Error: .68\nMean Squared Error: .77\nRSquared: 0.29\nRoot Mean Squared Error: .88\n------------------------------\nPrediction: 3.94\n------------------------------\n*******************************\nMatrix Factorization 10-50\n*******************************\niter tr_rmse obj\n 0 3.1309 9.0205e+05\n 1 2.3707 5.4640e+05\n 2 1.7857 3.3435e+05\n 3 1.5459 2.6501e+05\n 4 1.4055 2.2888e+05\n 5 1.3103 2.0634e+05\n 6 1.2430 1.9129e+05\n 7 1.1902 1.8002e+05\n 8 1.1493 1.7159e+05\n 9 1.1185 1.6546e+05\nLoss Function: 1.27\nMean Absolute Error: .89\nMean Squared Error: 1.27\nRSquared: -0.17\nRoot Mean Squared Error: 1.13\n------------------------------\nPrediction: 4.01\n------------------------------\n*******************************\nMatrix Factorization 20-100\n*******************************\niter tr_rmse obj\n 0 1.5068 2.5551e+05\n 1 0.9232 1.2707e+05\n 2 0.8675 1.1773e+05\n 3 0.8426 1.1358e+05\n 4 0.8260 1.1082e+05\n 5 0.8116 1.0874e+05\n 6 0.7984 1.0705e+05\n 7 0.7849 1.0547e+05\n 8 0.7699 1.0374e+05\n 9 0.7556 1.0222e+05\n 10 0.7407 1.0084e+05\n 11 0.7252 9.9587e+04\n 12 0.7108 9.8130e+04\n 13 0.6962 9.6890e+04\n 14 0.6845 9.6048e+04\n 15 0.6718 9.4877e+04\n 16 0.6615 9.4167e+04\n 17 0.6510 9.3413e+04\n 18 0.6419 9.2767e+04\n 19 0.6322 9.1971e+04\nLoss Function: 0.75\nMean Absolute Error: .67\nMean Squared Error: .75\nRSquared: 0.31\nRoot Mean Squared Error: .86\n------------------------------\nPrediction: 4.06\n------------------------------\n*******************************\nMatrix Factorization 20-100\n*******************************\niter tr_rmse obj\n 0 3.1188 8.9340e+05\n 1 2.4196 5.6643e+05\n 2 1.8203 3.4467e+05\n 3 1.5710 2.7129e+05\n 4 1.4210 2.3212e+05\n 5 1.3245 2.0894e+05\n 6 1.2559 1.9343e+05\n 7 1.2024 1.8189e+05\n 8 1.1592 1.7289e+05\n 9 1.1247 1.6594e+05\n 10 1.0956 1.6027e+05\n 11 1.0717 1.5566e+05\n 12 1.0506 1.5171e+05\n 13 1.0326 1.4838e+05\n 14 1.0169 1.4550e+05\n 15 1.0032 1.4306e+05\n 16 0.9907 1.4085e+05\n 17 0.9798 1.3893e+05\n 18 0.9698 1.3718e+05\n 19 0.9610 1.3563e+05\nLoss Function: 0.99\nMean Absolute Error: .78\nMean Squared Error: .99\nRSquared: 0.09\nRoot Mean Squared Error: .99\n------------------------------\nPrediction: 3.92\n------------------------------\n*******************************\nMatrix Factorization 30-100\n*******************************\niter tr_rmse obj\n 0 1.4902 2.5094e+05\n 1 0.9364 1.2934e+05\n 2 0.8672 1.1737e+05\n 3 0.8428 1.1349e+05\n 4 0.8264 1.1104e+05\n 5 0.8114 1.0883e+05\n 6 0.7966 1.0681e+05\n 7 0.7836 1.0532e+05\n 8 0.7698 1.0378e+05\n 9 0.7540 1.0209e+05\n 10 0.7402 1.0089e+05\n 11 0.7248 9.9437e+04\n 12 0.7098 9.7999e+04\n 13 0.6966 9.6791e+04\n 14 0.6826 9.5745e+04\n 15 0.6687 9.4572e+04\n 16 0.6593 9.3841e+04\n 17 0.6480 9.3017e+04\n 18 0.6404 9.2448e+04\n 19 0.6321 9.1986e+04\n 20 0.6238 9.1298e+04\n 21 0.6160 9.0879e+04\n 22 0.6090 9.0430e+04\n 23 0.6025 9.0006e+04\n 24 0.5962 8.9550e+04\n 25 0.5909 8.9269e+04\n 26 0.5859 8.9011e+04\n 27 0.5809 8.8598e+04\n 28 0.5764 8.8393e+04\n 29 0.5714 8.8086e+04\nLoss Function: 0.74\nMean Absolute Error: .67\nMean Squared Error: .74\nRSquared: 0.32\nRoot Mean Squared Error: .86\n------------------------------\nPrediction: 3.98\n------------------------------\n*******************************\nMatrix Factorization 30-100\n*******************************\niter tr_rmse obj\n 0 3.1699 9.2239e+05\n 1 2.4110 5.6279e+05\n 2 1.8361 3.4988e+05\n 3 1.5652 2.6961e+05\n 4 1.4201 2.3188e+05\n 5 1.3248 2.0902e+05\n 6 1.2537 1.9291e+05\n 7 1.2017 1.8175e+05\n 8 1.1583 1.7271e+05\n 9 1.1237 1.6575e+05\n 10 1.0953 1.6017e+05\n 11 1.0711 1.5555e+05\n 12 1.0502 1.5162e+05\n 13 1.0324 1.4834e+05\n 14 1.0168 1.4549e+05\n 15 1.0036 1.4316e+05\n 16 0.9905 1.4080e+05\n 17 0.9795 1.3886e+05\n 18 0.9697 1.3715e+05\n 19 0.9607 1.3558e+05\n 20 0.9526 1.3418e+05\n 21 0.9452 1.3293e+05\n 22 0.9384 1.3175e+05\n 23 0.9322 1.3070e+05\n 24 0.9265 1.2976e+05\n 25 0.9211 1.2883e+05\n 26 0.9163 1.2802e+05\n 27 0.9118 1.2727e+05\n 28 0.9075 1.2653e+05\n 29 0.9036 1.2589e+05\nLoss Function: 0.9\nMean Absolute Error: .74\nMean Squared Error: .9\nRSquared: 0.17\nRoot Mean Squared Error: .95\n------------------------------\nPrediction: 3.86\n------------------------------\n"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们使用用户 ID-6 和电影 ID-11 进行测试。如果你看一下数据集，你会发现这一对和评级是 4。正如你所看到的那样，大多数矩阵分解的变体都很好用。迭代 10 次，近似秩 50，学习率 0.01 的变化似乎最接近。而且，它的指标似乎也非常好。但是，还需要进一步的测试才能确定那种变体表现最佳。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"结语"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"本文涉及了很多方面。我们了解了不同类型的推荐系，接着研究了协同过滤和矩阵分解。另外，我们也有机会了解如何将其应用于电影推荐。最终，我们使用 ML.NET 实现了这一切。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"作者介绍："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Nikola M. Zivkovic，是 Rubik's Code 的首席人工智能官，也是《Deep Learning for Programmers》（尚无中译本）一书的作者。热爱知识分享，是一位经验丰富的演讲者，也是塞尔维亚诺维萨德大学的客座讲师。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"原文链接："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"https:\/\/rubikscode.net\/2021\/03\/15\/machine-learning-with-ml-net-recommendation-systems\/"}]}]}