作者归档:fanyy

为什么我劝你不要碰数字货币期货合约

嗯,这篇文章写在一次爆仓之后。•◡•
“爆仓”这个词对现在的我而言已经不陌生了,人生的第一次爆仓献给了bitmex,那时候根本啥都不懂。在18年玩现货亏得差不多连底裤都没了之后居然还指望去玩期货翻身,毕竟在币圈,做10倍、20倍杠杆期货翻倍太常见了,所以给人一种很容易赚钱的幻觉。事实证明,我还是太naive了,期货的难度远远大于现货,也就是说玩期货合约大概率是要亏钱的,这点毫无疑问。为什么呢?
首先,我之前觉得合约能赚钱的一个假设是:即使不关注盘面,每一次开单都有一半的概率翻倍,有一半的概率爆仓(翻倍和爆仓都是极端的说法,只是表示收益和亏损)。能够赚钱是因为基于这个基本假设我们可以做好两点:

  • 设定一个阈值严格止损,这样就不会爆仓了,同时一旦猜对了方向收益大概率会超过止损阈值
  • 盘面判断正确率大于50%

基于以上两点,如果开单的次数很多,从统计上来说确实是可以赚钱的啊,但为什么现实情况却是很多人都亏了钱呢?上面两个假设看上去很美好,但实际操作起来困难重重:

  • 你的盘面判断正确率能真的能达到50%吗?币圈是一个被严重操纵的市场,这就使得上面的第二点假设不成立了,你对盘面判断的准确率[……]

    继续阅读

为什么我不再从事算法的工作了?

结缘

从我2016年接触人工智能到现在已经有三年多的时间了,启蒙学习来自于吴恩达在斯坦福教的那一门CS229机器学习公开课,我当时(2013年)看的并不是现在Coursera上的那一门机器学习课,而是一个画质很模糊的公开课视频。由于画质太渣,有些板书公式的推导看不清楚,似懂非懂。但是,当时就有一个巨大的疑问一直浮现在我的脑海里:“机器到底是如何学习的?”带着这个疑问,2017年开始我就在Coursera开始正儿八经的学习机器学习了,不得不说Coursera上的那门《机器学习》真的很适合入门,比周志华的西瓜书好太多了,学完之后又去学了《深度学习》系列,整体而言难度并不大,用到的数学80%都是高中数学。

2016年下半年我就有了出国留学的打算,主要想法是工作了两三年觉得重复性的工作太无聊了,没什么激情,想趁着年轻出去看看外面的世界。当时选定的三个国家和地区是香港、新加坡和英国。英国想去的学校(比如帝国理工啥的)学费太高,伦敦地区的租房又很贵,超预算;新加坡的NUS需要考GRE,而且offer来的太晚;而NTU则没有什么好的CS硕士项目;那么很自然地就来到了香港。其实,那时候并没有抱着能[……]

继续阅读

Neo4j使用APOC导出cypher语句

我们知道,neo4j community版本不支持把数据库导出成cypher语句进行增量更新,也就是所谓的Hot Backup,只能整库dump/load停机冷备份,这样不便于不同数据库之间融合。一个解决办法是,根据图谱模型,自己写一个脚本生成cypher语句,这样比较麻烦;另一个是使用第三方工具APOC导出成cypher语句。具体步骤如下:

安装APOC

  • 下载

    前往https://github.com/neo4j-contrib/neo4j-apoc-procedures/releases/3.4.0.3 下载 apoc-3.4.0.3-all.jar

  • 安装

    apoc-3.4.0.3-all.jar放到neo4j安装路径的plugins目录下,即 $NEO4J_HOME/plugins/。如果没有可执行权限的话(一般是有的),还需要如下命令:

  • 修改配置

    neo4j.conf文件中添加以下配置:

  • 重启neo4j

    [crayon-5e[……]

    继续阅读

Neo4j如何表示带权重的关系

问题描述

我们知道图数据库可以用来表示节点之间的关系,大多数情况下,这个功能就足够使用了。但有时候我们希望知道这些关系的权重是怎样的,也就是说我们需要一个带权重的图(weighted graph)。比如,我们以上海周边城市图谱为例。先用如下cypher语句创建节点和关系:
CREATE (Shanghai:City {name:'上海'})
CREATE (Suzhou:City {name:'苏州'})
CREATE (Wuxi:City {name:'无锡'})
CREATE (Nanjing:City {name:'南京'})
CREATE (Ningbo:City {name:'宁波'})
CREATE (Shanghai)-[:Neighbor]->(Suzhou)
CREATE (Shanghai)-[:Neighbor]->(Wuxi)
CREATE (Shanghai)-[:Neighbor]->(Nanjing)
CREATE (Shanghai)-[:Neighbor]->(Ningbo)

可视化如下:
Imgur

解决方案

方法其实很简单:只要在关系[……]

继续阅读

关系抽取综述

什么是关系抽取?

信息抽取旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息。关系抽取是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系。比如:

International Business Machines Corporation (IBM or the company) was incorporated in the State of New York on June 16, 1911.

我们可以从上面这段文本中抽取出如下三元组(triples)关系:

  • Founding-year (IBM, 1911)
  • Founding-location (IBM, New York)

为什么要进行关系抽取?

  • 创建新的结构化知识库(knowledge base)并且增强现有知识库
  • 构建垂直领域知识图谱:医疗,化工,农业,教育等
  • 支持上层应用:问答,搜索,推理等。比如,对于这样一个提问:

    The granddaughter of which actor starred in the movie “E.T.”?

    可以用如下的关系推理表[……]

    继续阅读