16. Data scientists mostly just do arithmetic and that’s a good thing. https://m.signalvnoise.com/data-scientists-mostly-just-do-arithmetic-and-thats-a-good-thing/
17. Интервью для BBC Карл Густав Юнг, основатель аналитической психологии, 1955 год. https://www.bbc.com/russian/features-53475033
18. Тирания показателей, Джерри Мюллер. https://www.alpinabook.ru/catalog/book-542297/
19. Курс молодого бойца для Spark/Scala. https://habr.com/ru/company/retailrocket/blog/302828/
20. Задачи руководителя аналитики. https://www.quora.com/How-do-I-move-from-data-scientist-to-data-science-management
21. Ричард Хэмминг. «Вы и ваша Работа». https://habr.com/ru/post/209100/
22. Planning Poker: как сделать процесс постановки задач максимально прозрачным и четким. https://habr.com/ru/company/retailrocket/blog/334256/
23. Hypothesis Testing: How to Eliminate Ideas as Soon as Possible. Roman Zykov. https://recsys.acm.org/recsys16/industry-session-3/#content-tab-1-1-tab
24. Application of Kullback-Leibler divergence for short-term user interest detection. https://arxiv.org/abs/1507.07382
25. Нужен ли магазину «Стильный кросселл»: опыт Retail Rocket в анализе изображений для формирования рекомендаций. https://habr.com/ru/company/retailrocket/blog/441366/
26. The most powerful idea in data science. https://towardsdatascience.com/the-most-powerful-idea-in-data-science-78b9cd451e72
27. Элементарные понятия статистики. http://statsoft.ru/home/textbook/esc.html
28. Джин Желязны. «Говори на языке диаграмм».
29. Эссе «The Cognitive Style of Powerpoint: pitching out corrupts within» Edward R. Taftey.
30. Retail Rocket: 9 советов по увеличению эффективности парного программирования. https://habr.com/ru/company/retailrocket/blog/339358/
31. Retail Rocket: работа с бэклогом задач с точки зрения проектного менеджера в Retail Rocket. https://habr.com/ru/company/retailrocket/blog/329346/
32. Корпоративная культура Netflix. https://jobs.netflix.com/culture
33. Ecommerce dataset для рекомендательных систем компании Retailrocket. https://www.kaggle.com/retailrocket/ecommerce-dataset
34. «Антихрупкость архитектуры хранилищ данных». https://habr.com/ru/post/281553/
35. Колоночные базы данных. https://ruhighload.com/Колоночные+ базы+данных
36. Патент Google на MapReduce. http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/PTO/srchnum.htm&r=1&f=G&l=50&s1=7,650,331.PN.&OS=PN/7,650,331&RS=PN/7,650,331
37. MapReduce: Simplified Data Processing on Large Clusters. https://www.dropbox.com/s/azf00wnjwnqd2x8/mapreduce-osdi04.pdf?dl=0
38. The Friendship That Made Google Huge. https://www.newyorker.com/magazine/2018/12/10/the-friendship-that-made-google-huge
39. Apache Hadoop. https://hadoop.apache.org/
40. Apache Spark. http://spark.apache.org/
41. Решение проблемы загрузки мелких файлов на Spark. https://github.com/RetailRocket/SparkMultiTool
42. Маккини Уэс «Python и анализ данных» (Python for Data Analysis. Wes McKinney).
43. Cloudera Hadoop – Choosing and Configuring Data Compression. https://docs.cloudera.com/documentation/enterprise/6/6.3/topics/admin_data_compression_performance.html
44. Google colab. https://colab.research.google.com/
45. Kaggle notebooks. https://www.kaggle.com/notebooks
46. Gartner Top 10 Trends in Data and Analytics for 2020. https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/
47. Metabase. https://www.metabase.com/
48. SuperSet. https://superset.apache.org/
49. Beyond Interactive: Notebook Innovation at Netflix. https://netflixtechblog.com/notebook-innovation-591ee3221233
50. What Artificial Intelligence Can and Can’t Do Right Now. https://hbr.org/2016/11/what-artificial-intelligence-can-and-cant-do-right-now
51. Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа. Руководство для экономистов. Перевод с немецкого и предисловие В.М. Ивановой. М.: Финансы и статистика, 1983 г.
52. Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches. https://arxiv.org/abs/1907.06902
53. Kaggle’s State of Data Science and Machine Learning 2019. https://www.kaggle.com/kaggle-survey-2019
54. Unity is strength – A story of model composition. https://medium.com/criteo-labs/unity-is-strength-a-story-of-model-composition-49748b1f1347
55. Introduction to Machine Learning. Second Edition. Ethem Alpaydin.
56. Scikit learn Ensemble methods. https://scikit-learn.org/stable/modules/ensemble.html
57. XGBoost: Introduction to Boosted Trees. https://xgboost.readthedocs.io/en/latest/tutorials/model.html
58. LightGBM. https://lightgbm.readthedocs.io/
59. Catboost. https://catboost.ai/
60. Andrew Ng. Machine learning Yearning.
61. Coursera Machine Learning. https://www.coursera.org/learn/machine-learning
62. How do I learn machine learning? https://qr.ae/pN9vA4
63. Fastml4j on Scala. https://github.com/rzykov/fastml4j
64. Netflix prize. https://www.netflixprize.com
65. Netflix Recommendations: Beyond the 5 stars (Part 1). https://netflixtechblog.com/netflix-recommendations-beyond-the-5-stars-part-1-55838468f429
66. Andrew Gelman, Jenifer Hill «Data Analysis Using Regression and Multilevel/Hierarchical Models». https://www.dropbox.com/s/a82wwn6l74j5qka/Gelman-missing.pdf?dl=0
67. Google Course of ML: Imbalanced Data. https://developers.google.com/machine-learning/data-prep/construct/sampling-splitting/imbalanced-data
68. «10 уроков рекомендательной системы Quora». https://habr.com/ru/company/retailrocket/blog/341346/
69. «Как разрушился стартап, годами выдававший армию бухгалтеров за искусственный интеллект». https://www.forbes.ru/tehnologii/405589-kak-razrushilsya-startap-godami-vydavavshiy-armiyu-buhgalterov-za-iskusstvennyy
70. Yandex Toloka. https://toloka.ai/ru/
71. Drilling Down: Turning Customer Data into Profits with a Spreadsheet – Third Edition, Jim Novo.
72. Google Rules of Machine Learning: Best Practices for ML Engineering. https://developers.google.com/machine-learning/guides/rules-of-ml
73. В Норвегии с паразитами рыб борются при помощи подводных роботов с лазерами. https://habr.com/ru/post/402797/