本文共 836 字,大约阅读时间需要 2 分钟。
对于机器学习的一些模型,跑完之后,如果下一次测试又需要重新跑一遍模型是一件很繁琐的事,这时候我们就需要保存模型,再加载调用。
楼主发现有这些保存模型的方法,网上有很多错误的例子,所以给大家在整理一下。(python3)
1.利用pickle
import picklemodel.fit(train_X, train_y)s=pickle.dumps(model)f=open('svm.model', "wb+")f.write(s)f.close()print ("Done\n")模型保存这里的model已经是生成好的模型了,注意一定要用"wb+",否则会报错
f2=open('svm.model','rb')s2=f2.read()model1=pickle.loads(s2)expected = test_ypredicted = model1.predict(test_X)模型调用,注意读取方式'rb',否则会报错
2.利用joblib
from sklearn.externals import joblibmodel.fit(train_X, train_y)joblib.dump(model, "train1_model.m")print ("Done\n")模型读取
model1 = joblib.load("train1_model.m")expected = test_y predicted = model1.predict(test_X)模型调用
相对于上一方法,这个方法写起来简单明了多了。
好像还有cv方法的,楼主没有尝试。
这里的调用仅限在同一个py文件中,如果在另外一个py文件中调用,预测结果会出错,具体原因楼主也不清楚,楼主也一直在找一个在另外一个py文件中调用模型的方法,如果大家知道的话,也希望能告诉楼主,感谢!
考虑到如果预测数据又需要跑一遍模型,楼主的建议是,把保存模型的过程写进函数里面,下次不再调用该函数即可。
转载地址:http://nkuii.baihongyu.com/